跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • 看到一大波 Java 在转大数据,唯有我倒着走?
未分類
4 11 月 2020

看到一大波 Java 在转大数据,唯有我倒着走?

看到一大波 Java 在转大数据,唯有我倒着走?

資深大佬 : comsweetcs 12

前言

越来越多的 Java 后端转来搞大数据了,只有我倒着走,要回去搞后端嘛? 个人感觉大数据开发真的没啥意思,最有意思和有价值的工作在于机器学习,奈何能力有限。 说下对于大数据开发我的看法,首先说下这个类别岗位的主要意义,然后谈下工种分类。

大数据开发的价值

大数据开发的价值个人认为主要是为了给机器学习提供数据服务支撑,通俗点说就是让搞机器学习的同学 能更好的利用数据,保证数据的丰富性、准确性。

大数据开发的工种

大数据开发在我看来主要分为两个工种,一个是搞平台化开发、一个是面向业务的数据仓库开发。

  • 平台化开发岗 主要负责数据的采集、数据的治理、保证数据落到数仓过程中数据质量、保证数据的易用、易查。 主要工作内容就是运维、搭建 Hadoop 这些大数据程序、编写少量的代码。
  • 数仓开发岗位 主要负责数据仓库的构建,像运营、产品、机器学习人员提供数据。主要工作内容就是写 SQL 、写脚本跑 SQL 。

我的一些感悟

  • 可能我做得不够深,感觉前者和业务没多少关系,很容易陷入尴尬的局面,像个运维小哥。后者整天在撤 SQL,真是心累。
  • 大数据类的大多数工作对编码要求比较低,而且真有些代码也特别少。
  • 现在觉得还是后端开发有意思,却有一大波人要转来搞大数据。
大佬有話說 (66)

  • 資深大佬 : agriphar

    说得好
    那就转去搞机器学习嘛

  • 主 資深大佬 : comsweetcs

    @agriphar 能力有限,还是回去搞后端吧。

  • 資深大佬 : agriphar

    @comsweetcs
    也不见得,各有各的难点
    一大堆搞所谓机器学习的,写代码水平其实很一般,主要强在数学基础好(考研的时候猛刷一波题),通过考研等把学历刷上去光鲜一点
    对着吴恩达的课一顿猛干,也就慢慢上手了

  • 主 資深大佬 : comsweetcs

    @agriphar 我司搞机器学习的,都是 985,211.好几个北大,清华。感觉我们大数据就是给他们擦屁股的。我个人比较喜欢写代码。整天运维,搞 SQL 真是心累。

  • 資深大佬 : FireFoxAhri

    后端其实大多数也是 crud 吧

  • 資深大佬 : OysterQAQ

    大部分大数据开发=分布式计算引擎的搭建和使用+SQL
    但是实际上高大上的都在你说的数据处理侧那边,用数据来做机器学习之类的

  • 資深大佬 : OysterQAQ

    后端无非是业务牵扯更多一些,也就是熟悉库 不过范围比 Hadoop 那些东西小一些

  • 資深大佬 : liprais

    你猜猜算法工程师们用的数据从哪里来

  • 主 資深大佬 : comsweetcs

    @OysterQAQ 是啊

  • 主 資深大佬 : comsweetcs

    @liprais 我之前搞数仓的,就是我们给的。。。给他们提供一个脚本工具,抽过去就是了。。。

  • 資深大佬 : silentt

    现在搞大数据得已经沦落为 SQL boy 了,只有做机器学习的还听着高大上点,不过也有向 API boy 发展的趋势

  • 資深大佬 : agriphar

    @comsweetcs
    嗯,算法这一块儿,公司都特别看重学历,一般人你想搞也不给机会
    V 站经常讨论为啥要考研,这就是为啥考研的原因之一
    你考上了可以去搞算法,其他人只能帮你 CRUD 擦屁股

  • 資深大佬 : liprais

    @comsweetcs 那还是果断劝退吧,反正也做不出来啥东西

  • 主 資深大佬 : comsweetcs

    @liprais 哈哈哈哈,唉。

  • 資深大佬 : leafre

    围城

  • 資深大佬 : Jooooooooo

    机器学习 – 调参 boy

    大数据 – SQL boy

    后端 – crud boy

    前端 – 切图 boy

    你自己选吧

  • 資深大佬 : MinQ

    说实话哪有那么多项目需要机器学习和算法的,大部分项目不都是 CRUD,最多量上来了考虑一下数据库读写扛不扛得住,加上 Redis 啥的。现在算法内卷的比后端严重多了,不是名校研究生+顶会论文人家都不一定看你一眼。

  • 資深大佬 : wysnylc

    @silentt #11 大数据一个给机器学习打杂的之前被捧太高了,之后可能会被归并到机器学习
    机器学习就是纯粹的 API Boy 了,真能做到核心开发的我们接触不到

  • 資深大佬 : ren2881971

    当 SQL boy 真的很烦。。。

  • 資深大佬 : yeqizhang

    大数据如果是去做中台 数仓之类的,没有好的机会就是 sql boyer,让我去处理那些杂乱的数据的话,我觉得极其无趣

  • 主 資深大佬 : comsweetcs

    @ren2881971 平台搭建好后就是运维 boy 和 sql boy 两类人

  • 主 資深大佬 : comsweetcs

    @yeqizhang 数仓基本上就是 SQL BOY

  • 資深大佬 : outoftimeerror

    其实大数据做数仓挺好的,技术迭代慢,和业务比较近,再加上行业知识,中年危机没有其他技术岗位那么严重。

  • 主 資深大佬 : comsweetcs

    @MinQ 是的,因为算法确实值钱,导致很多人想扎堆进去。而且这玩意,人家清北的人已经建立起门槛,并不叫内卷,而是为了防止内卷。清北现在几乎垄断了国内一线大厂算法岗的内推渠道咯。

  • 主 資深大佬 : comsweetcs

    @outoftimeerror 要说业务把,还没有对应的后端清楚。要说技术吧,还没啥技术。中年危机慢,感觉只是进来做这个的人没那么多,一多起来,还不是一样。

  • 資深大佬 : MinQ

    @comsweetcs 算法能落地了才有可能值钱,落不了地的一律不值钱。每年顶会论文多如牛毛,但大部分都是水 paper,工业界参考更多的还是 FAAG 家发的论文,因为都有场景落地了。

  • 資深大佬 : newmlp

    主要是钱多吧

  • 資深大佬 : wangyzj

    面向工资编程
    最近这几年大数据啥的给的的确多,岗位多,而且啥职位都需要懂大数据
    不过现在转是不是晚了点
    感觉这个财富密码要过去了

  • 資深大佬 : oluoluo

    搞 k8s docker 那一套的是不是也算是运维。。

  • 主 資深大佬 : comsweetcs

    @oluoluo 哈哈哈哈。感觉那是妥妥的运维

  • 資深大佬 : la2la

    刚面试到大数据岗位,看着大家吐槽突然没了信心,不过我不是后端转的而是 爬虫 -> python 数据开发 -> 大数据开发的路线 0.0

  • 主 資深大佬 : comsweetcs

    @la2la 加油加油。每个人环境不一样,我只是个人见解,不一定对阿。

  • 資深大佬 : stevenhawking

    Tenet

  • 資深大佬 : ob

    大数据工资普遍去后端高点。

  • 主 資深大佬 : comsweetcs

    @ob 对于小厂是这样。对于大厂其实几乎一个价,有时候后端还更高。

  • 資深大佬 : abcbuzhiming

    @comsweetcs 算法也正在卷,没看现在形容算法用的是算法“岗”了吗?

  • 資深大佬 : outoftimeerror

    @comsweetcs 不知道互联网是什么行情,但是外企的话肯定是数仓比后端好,以我了解的快消为例,依赖电商平台和线下门店渠道,前后端开发基本上不怎么招人,但是因为国家禁止消费者数据传输到国外,数据分析数仓国内岗位还是挺多的。

  • 主 資深大佬 : comsweetcs

    @abcbuzhiming 哈哈哈哈哈哈,好吧。

  • 主 資深大佬 : comsweetcs

    @outoftimeerror 哈哈哈,那要是不看行情,你觉得哪个工作比较有意思。

  • 資深大佬 : impl

    后端不需要写 sql 吗

  • 資深大佬 : V3EXhayongma

    @la2la 兄弟,python 搞大数据的岗位多吗?薪水怎样啊?

  • 資深大佬 : zzzhen

    啊这

  • 資深大佬 : zzzhen

    在转大数据,看到这个心里一凉。。。

  • 資深大佬 : DamonLin

    我的同事之前就是学大数据的,跟我说大数据确实是 sql boy,不过人家原生的 sql 是写得真的 6

  • 主 資深大佬 : comsweetcs

    @DamonLin

  • 資深大佬 : Dragonphy

    有没有具体的大数据开发岗啊,不会真主要内容是运维吧,我还不如去做 devops 呢

  • 主 資深大佬 : comsweetcs

    @Dragonphy 也有专门搞具体框架研究得,比如 HBase,要研究得很深,基本上就是 DBA……。这种一般大厂才养得起……。大多数职位就是我上面说的两种。

  • 資深大佬 : dswyzx

    面向工资编程,就一目了然心无旁骛努力搬砖建设四个现代化

  • 資深大佬 : neetrorschach

    正在某鞋厂用 talend 做数据质量分析,快疯了。他们的 HBase 还老报错。

  • 主 資深大佬 : comsweetcs

    @neetrorschach 哈哈哈哈

  • 主 資深大佬 : comsweetcs

    @dswyzx 那工资要是降了,你是不是要换岗咯

  • 資深大佬 : mohulai

    工作需要看过一段时间机器学习,挫败感很强,工作能做,可一想到要出类拔萃就要很强的数学功底,对我来说遥不可及,就很失落,没有做后端的那种动力。

  • 資深大佬 : Rexxar

    @mohulai 看到那么多人西瓜书之类的数学原理讨论起来头头是道,我就知道我不是这块料。

  • 資深大佬 : WalkingEraser

    游戏 boy 还想出来当 Java crud boy,有点围城啊

  • 資深大佬 : dayeye2006199

    第一个平台开发总结的有点片面,有很多数据平台开发工程师其实是 infrastructure 工程师,魔改和部署各种开源工具,或者搭建自己的数据平台解决方案。例如,拓展数据查询引擎的功能,spark, presto,拓展和运营工作流 scheduler,搭建数据发现平台啊什么的。都是比较硬核的工程师工作。

    第二种其实有点像数据工程师 data engineer,的确 SQL 是主要技能了,可能还包括写一些 pipeline

  • 資深大佬 : whasyt

    大数据开发 = sql boy 坐实了,搭好框架就是 sql 脚本一把梭

  • 主 資深大佬 : comsweetcs

    @dayeye2006199 稳定了后还不是运维。我们公司搭建 kafka 的天天背着电脑,聚会都背着。警报电话一来,就得处理,你觉得这是运维吗

  • 資深大佬 : wudalang123

    大数据现在赚钱啊, 什么赚钱搞什么,java 就是个工具,早晚会过时

  • 資深大佬 : NerverLibis

    来一起转运维,背着小书包,睡在恒温恒湿的机房,美滋滋摸鱼。

  • 資深大佬 : fewok

    还有一个方案,我就打算去搞 golang,云原生去

  • 主 資深大佬 : comsweetcs

    @wudalang123 java 是一个生态,ok ?

  • 資深大佬 : shijia

    写 SQL 的在这里 你看我签名

  • 資深大佬 : yanzixuan

    @la2la 最后搞大数据开发,还是要学 java/scala 才行。我的路线跟你差不多。。
    现在一边搞大数据,一边搞 curd 。。。

  • 資深大佬 : yanzixuan

    @comsweetcs 你们的 kafka 集群这么容易出问题?

  • 主 資深大佬 : comsweetcs

    @yanzixuan 不是容易出问题,是要时刻带着,一出问题要立即修复。我们搞金融的,你说呢,数据就是金钱。

  • 資深大佬 : young1lin

    上上个月刚写了个 UDAF 给别人用,还可以做大数据可视化开发啊,比如 CDH 那种

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具