网课邦

当前位置:首页 > 网课资讯

网课资讯

智慧树期末考试概率论_大专学历可以学习大数据吗

时间:2025-05-15 13:45:50 作者:暂无作者 浏览量:
内容页左侧

智慧树期末考试概率论,大专学历可以学习大数据吗?

谢谢,邀请回答。

这个问题很有意义,实际上在我周围就有好多大专学历的在做大数据,而且做的还挺不错的,其中做得比较好的,还有自己的大数据作品,获得阿里云的比赛大奖。

从可能性上来说,大专学历做大数据一点问题都没有。

下边我们再从大数据要涉及到知识层面上来分析一下大专毕业的做大数据,是没问题的。

大数据涉及linux操作系统,网络架构和程序开发以及系统层面的知识。这些知识基本上和数学的关联性都不是说特别强。只要大学毕业甚至,高中水平的,只要能够钻进去,学习这些知识,一点问题都没有。在大数据领域,如果做程序开发,不做系统架构的话,甚至可能比这个要求还要再低一点,这样可能操作系统层面上的就不需要知道的这么多这么丰富,只要按照相关的大数据接口来开发程序就行。

综上而言,大专毕业的来做大数据一点问题都没有,希望大家有机会来做大数据的话,不要再有学历之见。谢谢大家。

1.大数据是可以学习掌握的知识学问。

2.人类都具备学习的能力。

3.大专生是人。

4.大专生可以学习并能掌握大数据。

另外就是要考虑学习的目的,学习的方法手段。跟年龄、专业、背景、性别等等无直接和决定性关系。

大专生只是一个人的学历,不是代表他的能力。大数据已经发展成为一门成熟的技术,应用领域非常广泛,只要制定好学习路线,坚持不懈,相信大专生也能成为大数据专家。

肯定可以啊!就业前景还是不错的,加油!

不能只看大背景,因为专业、专业人数等限制,加之是大专学历,可能会造成一定程度的就业困难。但是关键看自己,如果就业方向不受专业限制,尝试找其他岗位的工作,还是可以的。再有就是自己工作能力,如果谦虚好学,很多企业还是喜欢聘用。也可以尝试提升一下自己的学历,学历高一些,竞争平台也就大一些。

可以学习,但是付出的努力比较大,只要敢想敢干,没什么大不了,兴趣破最好的老师。

当然可以,大数据是现在一致未来都会非常热门的专业。习大数据有中专学校大转学校,只要孩子有兴趣,能够认真学习,加上选择了正规的学校。将来一定会很不错的。

可以的,我有朋友就是大专学的开发,目前工资一个月8000+。

读穷查理宝典?

《穷查理宝典》给我最大警示的就是查理芒格在哈佛大学的演讲。他用很幽默的方式讲了人生失败的经验,告诉人们做哪些事情注定会失败,警告人们避开做那样的事情,避开走那样的路:

是放下嫉妒和怨恨。查理芒格提到卡森一次又一次尝试了这些东西,结果每次都会失败。怨恨和嫉妒,最终伤害的是自己,它使自己无暇去做真正对自己有意义的事情,将精力耗费在怨恨和嫉妒的苦海里。

他说:“任何人都或许通过一个开始难以察觉直到堕落之力强大到无法冲破的细微过程而染上耳瘾。我活了60岁,没有见过有谁的生活因为避开这些诱惑性的毁灭之路变得更加糟糕。”

其次是避免反复无常,做事三天打鱼两天晒网。养成这种习惯,人就会绰绰有余抵消所有优点共同产生的效应。

再有,一定要避免只从自身的经验获得知识,而不从他人的成功或失败中吸取教训,不管他们是古人还是今人。

非常喜欢其中引用爱因斯坦的一句话:

那些成功的理论来自好学、专注、毅力和自省。自省就是不停地试验与推翻自己深爱的想法。

书中有一段原话,很风趣,但却让人有醍醐灌顶之感,它警告人们对过分着重自我、忠实于自己的错误认识带来的后果:

如果你们认为忠实于自己是永远不改变你们年轻时所有的观念,那么不仅将会稳步地踏上通往极端无知的道路,还将走向事业中不愉快的经历给你带来的所有痛苦。

以上这段在哈佛大学的演讲我读过这本书后一直在学着使用,虽然短短两年,我觉得我的人生之路因此而豁然开朗。

还有几句箴言也会时时提醒或警示我,因为我挺容易犯错,所以它们像好朋友一样陪伴我

1、空麻袋立不起来。

不要让自己空空的,想学什么,想做什么,尽可能去学,去做,只要能对他人对社会有贡献,别怕自己的付出。

2、诚实是最好的策略。

不说谎言,对自己诚实,对交往者诚实,将获得最大的回报。

3、学科之间融会贯通。

把知识学活,知识才能为己所用,也就能做到融会贯通,懂得了跨学科的价值和应用。实际,上所有的知识和学科都有通路。

4、守时。

守时是尊重他人的最好表现。查理芒格不论和谁约会都会让自己提前特定时间到,从来守时,这种对他人的尊重,我认为没有比这更高贵的品格了。

5、聚焦和坚持不懈。

专注和坚持,这才是最高级的努力。

6、乐观主义在会计中没有容身之地。

人需要为自己的财务考虑长远,深谋远虑才有未来。

我诚挚地接受这位睿智老先生的祝福,虽然这祝福不是特意给我的:愿你们在漫长的人生中日日以避免失败为目标而成长。

这本书还让我深切理解了投资的意义,人的一生都是在投资,既然是不会投机的人,我会好好学习,坚持对自己的长线投资。

概率和统计别?

统计学合称为“概率统计”,但显然这两者是有关系,但不是同一的,那么二者的关系究竟是什么呢?

简单来说,概率论研究的是“是什么”的问题,统计学研究的是‘怎么办“的问题。

统计学不必然用到概率论,比如用样本均值来表征总体某种特征的大致水平,这个和概率就没有关系。

但是因为概率论研究的对象是随机现象,而统计学恰恰充满了无处不在的随机现象:因为要随机抽样。因此概率论就成为了精确刻画统计工具的不二法门。

概率论是统计推断的基础,在给定数据生成过程下观测、研究数据的性质;而统计推断则根据观测的数据,反向思考其数据生成过程。预测、分类、聚类、估计等,都是统计推断的特殊形式,着重对于数据生成过程的研究。

统计和概率是方法论上的别,一个是推理,一个是归纳。

打个比方,概率论研究的是一个白箱子,你知道这个箱子的构造(里面有几个红球、几个白球,也就是所谓的分布函数),然后计算下一个摸出来的球是红球的概率。而统计学面对的是一个黑箱子,你只看得到每次摸出来的是红球还是白球,然后需要猜测这个黑箱子的内部结构,例如红球和白球的比例是多少?(参数估计)能不能认为红球40%,白球60%?(假设检验)

而概率论中的许多定理与结论,如大数定理、中心极限定理等保证了统计推断的合理性。做统计推断一般都需要对那个黑箱子做各种各样的假设,这些假设都是概率模型,统计推断实际上就是在估计这些模型的参数。

概率论是统计学的基石。

统计学是从旧时的赌博来的。当时的赌徒们通过历史数据的记录,逐渐出了描述性统计。利用这些描述性统计的数据,使得他们胜率直线上升。哪个有赚哪个稳赔,哪个波动大没规律,这些经验逐渐成为了知识,并在之后的各个领域里体现了这种智慧。

赌博中的统计,就是要用以往的胜败估计下一次成功的大小。为什么能够这样做,为什么以往的数据能对下一次数据有较为准确的估计,这是概率论要说清楚的。大数定律的三个定理就是要说明为什么样本均值可以估计总体均值。这个估计的准确性却是要由统计学说的,对于各种分布的参数估计,之后的模拟估测,虽然与概率论看似完全无关,实际上却是由他们在支撑着统计学这个科目。这个情况对于参数统计,非参数统计,半参数统计,都是一样的。

起来,一个是对原理的讨论,一个是对方法的讨论。

科学与宗教是什么关系?

对于科学与宗教的关系,通常的看法是二者对立,最终科学战胜宗教,才获得发展。如果从表面现象来看,这种看法也是有道理的。因为科学确实发展了,而宗教的影响也大不如前。

但是,这种的看法是不全面及不准确的。如果科学与宗教是对立的,那么它们是如何对立的?在什么层次和性质上对立?是宗教的哪一种因素与科学的哪一方面对立?这些问题都没有很清晰的答案和了解。这是因为我们缺乏这方面信息的了解,即使我们有机会看到这方面的信息,其信息内容也是经过过滤后才进入我们的视野。

我们如果要明白科学与宗教的关系,就要了解什么是科学?其实,科学这个词是一个外来词,古汉语里面没有这个词,它是英文Science的一个翻译,而且还是日本人翻译的。日本人觉得西方人的这个学问,Science,跟我们中国儒家的学问不大一样,儒学是综合性的学问,文史哲不分,而这个Science是一个分科性的学问,数、理、化、天、地、生,所以把它翻译成科学,取分科学的意思。

科学发源于西方,特别是希腊。虽然希腊的文明算不上最古老,在实用知识上算不上最有成就。但却创造了所谓的科学精神,即超越功利、自由地看待世界、研究世界,并在此基础上创造了科学的原始形态理性科学,以及创造了第一批理性科学:哲学和数理科学。

理性科学的产生需要三个条件,这在亚里士多德在《形而上学》这本书都有提到。第一个条件是“惊异”,就是人们对于自然现象和社会现象所表现出来的困惑和惊奇,有了惊异也就感受到自己的无知,自知其无知者为了摆脱无知就求知识。求知并非为了实用的目的,而纯粹是一种对智慧的热爱。简单的说,第一个条件是要求人们有好奇心和求知欲。第二个条件是要有空闲。因为整天从事繁重体力劳动没有空闲的人,是无法从事求知这种复杂的脑力劳动的。第三个条件是自由。哲学知识是一门自由的学问,它要求自由的思考、自由发表意见,不受其他目的和利益的支配。

希腊理性科学的产生,是出自于对自然的好奇与理性求知的态度,与利用自然和生产力无关。

而把科学与利用自然的态度结合起来,是出于另一种价值理解,即基督教的信仰。但是,今天有很多人认为科学与宗教是水火不相容的,是宗教妨碍了科学的进步。可是,我们从历史中明明可以看见,近四世纪以来,现代科学的发展,可追溯到欧洲中世纪基督教大学中的教师(Schoolman)。他们继希腊之后,首次再以客观理性,严谨探讨自然万物,重视思想合理化,并锲而不舍、潜心研究的精神,奠定了现代科学的基础。欧洲首创从事科学研究的伦敦皇家学会(RoyalSociety),初期会员中百分之九十为基督徒,而当时社会中基督徒仅占人口百分之二十。

具体而言,基督教对近代科学发展的影响,约有三个方面:第一,世界是上帝的受造物,故世界本身是一种偶性的存在。第二,世界虽为偶性存在,却不是任意紊乱的存在。理性的上帝创造了具有内在理性的世界,并按上帝形象创造了人类,故理性的人类可以全面揭开世界之谜。第三,也是最关键的,人类是上帝创造的中心,自然不过是人类使用的对象,是为人类服务的,创1:28—29。此种观念与希腊思想不同。希腊人对于自然的兴趣是求知,而基督教文化对自然的态度则是使用。希腊人认为自然是必然存在,故可以通过公理系统演绎方式推导出关于自然的知识。希腊的科学理想是演绎推导,故希腊人没有兴趣作实验;而基督教文化则认为世界是偶性存在,故此必须通过实验的方式一点一滴地揭开自然之谜。欧洲最早的实验科学,就是产生于中世纪的修道院。亚里士多德关于落体的速度取决于重量的错误理论,上下一千年,竟没有一人费神去验证一下,直到伽利略的时代,也就是基督教文化的科学理想上升的时代,才被实验证明出来。

因而,正是基督教文化的兴盛,才有近代实验科学传统的兴盛。在17世纪将结束的时候,这样一套崭新的自然观和方法论确实建立起了。而且在飞速增长的自然知识领域发挥作用。它们就是近代科学的机械自然观和实验——数学方法论。

到底科学与宗教是什么关系呢?我用爱因斯坦的一句话来回答:没有宗教的科学是盲目的,没有科学的宗教是跛足的。而著名的数学家,哲学家,逻辑学家,罗素的老师和同事怀特海。他也有一个观点:影响人类最大的两种力量是宗教与科学。

这两天看到一个关于“科学与宗教是什么关系?”的回答,我看完之后发现。其作者从头到尾并没有对这个问题作出回答,而是一通不合逻辑的针对其他宗教(基督教)批判和自己所信仰宗教的吹棒。本人实在是看不下去,虽然学历低微,仍要勉励回答。

其一,作者在关于“上帝是谁”的问题,他马上提出费尔·巴哈《基督教的本质》。费尔·巴哈在书中把宗教的本质归结于人的本质。但是,人的本质并不是单个人所固有的抽象物,在其现实性上,它是一切社会关系的总和。费尔·巴哈的问题是仅仅把人心理的活动看作是真正人的活动。可见费氏,是从不客观全面的理论前设去推论出一套理论,其本身就有问题。(比如:我们都晓得“水能灭火”这个前设,当电视机烧起来的时候,是不是用水来灭呢?回答是:不可以。因为现代人都知道,瞬间降温会使电视机内的显像管发生爆炸。要用湿的棉被盖在电视机上。可见,只有全面的知识前设才能推论出正确的理论。)这是人尽皆知的道理,而今天有人竟然还用这个错误的理论来批判基督教真理,这实在是可笑的事情。

其二,作者用了费氏的理论说“神学的秘密就是人学,换言之,神学实质上就是人学。”这显明他根本不懂神学,神学是认识神的一门学问。人怎么认识神呢?并不靠自己的能力与智慧去寻求,而是靠神亲自向我们显明。作者认为“不揭示人的秘密也就不能揭示神的秘密”这是一种本末倒置的想法。我们要知道神跟人是本质性的不同,怎么透过认识研究人,就能了解神呢?打个比方:一个木匠造了张椅子,我们不能说,我们只透过这张椅子才能了解这个木匠。

其三,作者藉着费氏的理论,继续说宗教乃是人意识的产物,人怎样想,神也就是怎样的。我都要笑掉牙了,因为基督教对神所有的认识都源自于神的启示,反而是佛教里面的满天神佛才来自于人的意识想像。正如罗马书所说:因为,他们虽然知道神,却不当作神荣耀他,也不感谢他。……将不能朽坏之神的荣耀变为偶像,仿佛必朽坏的人和飞禽、走兽、昆虫的样式。今天你走进庙宇看到的一座木雕、泥塑、石刻、纸画的一个个神佛,有的是人、有的是动物。这些假神都被关在庙宇里面,而我们所信仰的神是充满天地之间,你去教堂可以看得到这些物质神的像吗?佛教的这些神佛才根据人内心不同的需要,被想像造出来的。 从头到尾作者的前设、推论和认识都是错误,甚至是对自己的信仰认识是不清楚的。

其四,作者接下来照着这个思路继续推论下去,他还是以人为信仰的出发源头,来讲解佛教的理念。从头至尾来看,其实佛教的理论就是无神论。特别是对“觉”的解释,他认为“觉”是人人本有的超级机能。这也等于,把人内在的能力提升到无上的地步。这显明作者对人的有限,缺乏认识。人为什么会寻求信仰,就是认识到人的有限,人有很多事情是无法解决的。他的认识已经没有什么新意,我就简单再说一点:任何的宗教如果没神自我显明,是没办法谈神的,因为我们对神是一无所知的。他们只能退而谈论人。

其五,作者认为西方很多的危机全归纳为科学研究带来人类异化,其实,西方科学研究是在基督教信仰的沃土上成长起来的。近代因科学研究偏离了基督教信仰才带来异化。大家可以去研读一些西方科学发展史就能明白。他继续用人的意识出发,批判西方的科学与基督教信仰(注:基督教信仰起源于东方)。在这里我不一一反驳与详述。

其六,作者认为中华文化可以解决,西方宗教与科学的问题。作为中国人我也以中国文化为傲,但是中国文化很显然被他无知地抬高到无上的地步。至于中国文化,我们还是请懂得中国文化的人来谈谈吧!木心先生在他的《文学回忆录》里面讲到:“春秋战国的哲学黄金时代,奇就奇在出了一批天才——三百年出十个哲学家,以西方概率论,不算太多——不幸,中国从那时以后不再出哲学家了,吃老本吃了两千多年,坐吃山空。一穷,穷在经济上;二白,白在文化上;三空,空在思想上。唯物论之类进来,没有抵挡。”(《文学回忆录》,168页)“具有永恒性、世界性的中国哲学家,恐怕不多,大概一个半到两个。诸子百家,是伦理学家,研究社会结构、人际关系;是政论家,讨论治国之策。只有老子思考宇宙、生命。”(《文学回忆录》173页)从中可见,中国文化的断层导致唯物论的盛行,而中国两千年以来的文化主流就是讲人伦的。而佛教进入中国,吸收了中国本土文化的思想。佛教进入中国的时候恰恰是独尊儒术的时代。

从中可知,作者谈论科学、宗教,为何会以人的本质和唯物思想为出发点。 当然,中国文化有没有产生科学、民主等等可能?木心先生回答是:可能的。“如果两千年来中国取墨子思想,修身、齐家、治国、平天下,那么赛先生和德先生不用外国进口,早就大量出口。墨子思想就是科学、民主、平等、博爱的先驱。”(《文学回忆录》199)我要再次谈谈关于佛教的事情,我们都知道佛教是释迦牟尼。释迦牟尼所悟的教义叫做《缘起论》,共分为四方面:1、无造物主,2、无常,3、无我,4、因果相继。在这四点里面,因为针对我所要谈的问题,我只谈其中的两方面:

1、无造物主,释迦牟尼不认为有一位全知全能、创造宇宙万有的造物主。有人就问万有从哪里来的呢?他的回答是由于因缘而生,什么意思呢?打个比方来说,父母生孩子,父母是因,儿女就是缘。那么一层一层的往上推,如果我们问佛教第一因是什么的话,就没有答案了。佛教认为讨论第一因是没有意义的,因为他们根本就没有答案。从这个教义来说,佛教是一个无神的信仰,佛教的根本教义是不相信有一位全能的神。但是我们发现今天许多的佛教徒,竟然把佛陀当成万能的神来拜,这绝对是佛教信仰的异端。真正对佛教教义有深入研讨的那些和尚对此肯定知道,但是有一点我想不明白,那么多普通佛教徒信错了,为什么那些懂得真正佛法的人却不加以改正,而且还允许这种错误的现象存在。

3、无我,这一点是释迦牟尼反思印度婆罗门教的教义得来的,他认为世上一切事物都由因缘而生,因缘若灭则事物也灭,所以就不存在一个控制一切的自我,简单的来说这个自我就是人的灵魂,无我也就是没有灵魂。当时释迦牟尼的思想是从婆罗门教义而来,婆罗门教义认为人有一个起自我主宰作用的自我,就是灵魂。而释迦牟尼认为没有,所以这个教义很清楚表明,整个缘起论,佛教的核心教义其实是一个无神论的思想。 同时,因果论表明有来世的观念,因而在婆罗门教义的基础上发展出六道轮回。从中可见,这个信仰不但是无神的信仰,甚至是充满矛盾的。为什么这样一个无神又充满矛盾的信仰会被中国人所接受呢?

一百多年前,有一位美国的博士名叫丁韪良,这个人是京师大学堂的第一任教导主任,同文馆的总教习。他来到中国后对中国人宗教信仰有深入的研究,他提到了为什么佛教得到中国人的接受。他说佛教的包容性很强,为了适应中国人信仰的需求,他们熔入了中国本土的文化,同时,为了给中国人提供一个有吸引力的崇拜目标,他们提出了一个观音菩萨,并使她成为中国佛教徒最喜爱的一位神。虽然佛祖在寺庙中占据了一个最关键的地位,但是观音菩萨却在佛教徒的心中占据了首要位置。经过他观察发现,经常有一些中等的寺庙是专门为观音而建造的;而大型的寺院里,她也几乎总是有一个独自的神龛或角落。

而观世音的信仰是不成立的,而观世音也不是真实的历史人物,这是台湾的圣严法师亲口所说。台湾的圣严法师曾经在日本攻读佛学,并取得博士学位,他在2007年四月的时候,与台湾著名的作家龙应台女士,谈过一次话,谈话的地点就在他自己所主持的道场,他说:“观世音菩萨,并非真实的历史人物,……如果从学术的角度探究,观世音的信仰是不成立的。”当然,我个人是非常佩服圣严法师的诚实与勇气,清楚明白说出事实的真相。

其实,如果透过历史去了解,我们就知道圣严法师所说的全部是事实。 观世音最早是印度男神,随着佛教而传入中国,进入中国观世音像也是男人相,南北朝以后才有女像的观音出现。为什么男像变女像呢?因为在世人的情感里面认为女性的神,比男性的神更加慈悲、温柔、怜悯,也更有同情心。这就是观音男像变女像的原因,直到今天中国仍然有几处的观音像是男的:比如甘肃敦煌的莫高窟、湖北当阳的玉泉寺,以及四川广汉的龙居寺。

当然,要想让观音被中国人所接受,就不是简单地把男像变成女像,我们要看看观音信仰的经典,叫《观音普门品》,这卷经典不长才四页纸,这部经典里面的内容才是中国人接受佛教的真正原因。这部经典的一些特色,其实是非常讨好中国人的心理需要。

“若有女人,设欲求男子,礼拜供奉观世音菩萨,便生福德智慧之男。”这是说如果有女人要生个儿子,只要敬拜供奉观音,就能生出一个有福气、有品德、又有智慧的男孩子。这是赤裸裸地因中国人的文化,而作出的改变。

“设复有人,若有罪,若无罪,钮械枷锁检系其身,称观世音菩萨名者,皆悉断坏,即得解脱。”就是说,如果有人被脚镣手铐锁住而失去自由,不管是冤枉的,还是罪有应得,只要称颂观世音菩萨名号,脚镣手铐就会断裂,立刻就能脱身得自由。这种是非不分的神力释放,实在是违反人间公义,也是破坏社会法制的做法,但是这也是中国人的做法,只讲究人情关系,常常破坏法制,我们常常说的有关系就是没关系,没关系就是有关系。这一条非常适合我们中国人的做法,因此却能吸引更多的信徒。

“咒诅诸毒药,所欲害身者;念彼观音力,还著于本”意思说如果有人要以咒诅或毒药害另一个人的话,只要被害的一方颂念观世音菩萨,就有神力能将这些咒诅或毒药,反加在加害人的身上。这一条十足的报复和仇恨的心态,这是中国人喜欢的,中国人常讲君子报仇十年不晚,中国人有仇必报的,仇恨报复心态是非常强的。

如果从其经典上看,观世音的出现就是为了适应中国人的文化而作出的改变。而真理是永远不改变的,比如:2+2=4,在中国是如此,在美国也是如此,在世界任何地方都一样,这是普世性的,我们绝不会看到2+2=5,不会变来变去。 讲了这么多,所有的是非对错,还是请诸君自己思考与决断。

大数据主要学习哪些内容?

要从事计算机行业的工作,不管是什么工作,开发、测试、还是算法等,都是要有一门自己比较熟练的编程语言,编程语言可以是C语言、Java、C++等,只要是和你后续工作所相关的就能(后续用到其他语言的话,你有一门语言基础了,学起来就快了)。一般初学者入门语言大多都会选择Java、C语言、C++或者Python,而且现在网上有很多好的视频,可以供初学者学习使用。关于学习视频或者资料的选择,知乎或者百度等都有很多讲解了,也可以跟师兄师姐咨询,这样可以少走很多弯路,当然,有人说,走一些弯路总是有好处的,但是我这里说的弯路不是说不犯错误,不调bug,而是指学习资料以及一些知识点的偏重点,这样可以尽量节约一部分时间,刚开始时,总会有点迷,而且当你真正投入进去学习时,会发现时间总是不够用。

我前面是做的Java后端,后续才转的大数据,所以一些Java开发所需要的东西自己也有学习过,也都是按照正常的路线走的,JavaSE阶段,然后数据库,SSM框架,接着做了一些网上找的项目,之后发现对大数据比较感兴趣,就开始找大数据相关的资料学习,看视频,看博客,敲代码,前期大概花了3-4个月吧(公众号的这些资料就是我当时看过的),也是一步步艰难走过来的,刚刚开始接触大数据相关的东西时,一度怀疑这么多东西自己能否学得完,是不是能用得到,学完又忘了,忘了又回头看,不过还好,坚持过来了,还好没有放弃,工作也还ok,找的大数据开发岗,待遇也还不错吧。

下面就说一下我自己从Java开发到大数据开发的曲折学习之路(狗头保命.jpg)。因为我现在是做大数据相关的工作了,所以Java后端涉及到的一些SSM框架等知识点我就不介绍了,毕竟后续一段时间也没有做了。自己看过的大数据学习相关的视频+资料大概是200G-300G吧,从Linux->Hadoop->。。。->Spark->项目,还有就是一些面试文档,面经等。一些视频看了两遍或者更多,跟着学,跟着敲代码,做项目,准备面试。涉及到需要学习的东西包括:JavaSE,数据结构与算法(计算机行业必备),MySQL,Redis,ES(数据库这些可以看项目,也可以自己熟练一两个),Linux,Shell(这个可以后期补),Hadoop,Zookeeper,Hive,Flume,Kafka,HBase,Scala(Spark是Scala写的,会Scala做相关的项目会更容易入手),Spark,Flink(这个是找工作时有面试官问过几次liao不liao解,所以找完工作才开始接触学习),相关项目。

编程语言阶段学习

  如果是零基础的话,建议还是从视频开始入门比较好,毕竟一上来就看教材,这样有些代码的来龙去脉可能不是很了解。如果是有一些编程语言基础的话,从视频开始也会更简单,一些for、while循环你都知道了,学起来也会快很多。  JavaSE我是选择的某马刘意的为主,因为刚刚开始学Java看过一本从《Java从入门到精通》,没什么感觉,后续又在看了某课网的Java初级视频,还是没感觉出来啥(当时就有点怀疑自己了。。。),可能有点没进入状态。  还好后续找了某马刘意老师的JavaSE视频(我是看的2015年版本,那时候19版还没出),觉得他讲的真的是很好很详细,每个知识点都会有例子,也都会带你敲代码,做测试,可能前面有C语言基础,然后也看过Java的一些语法,所以学起来还是比较顺利,后面的IO流、多线程等知识点时,也有看书看博客,或者看看其他老师的课程,讲解的可能自己比较容易接受就能,反正都是多尝试(下面会给出视频链接),尽量懂一些,后续可以回头来复习。JavaSE相关的视频,先看一遍,后续有时间建议再看一遍,而且这些经典的视频,看两遍真的是享受。  如果有一定基础了的,JavaSE前面七八天的视频可以加速看,但是不懂的一定要停下开仔细想想,零基础的还是尽量不要加速吧,慢慢来稳些。后面的视频建议还是跟着视频来,尽量不要加速,代码尽量都敲一敲,第一遍基本上一个月到一个半月可以结束。  JavaSE能够说是很基础也很关键的东西,主要重点包括面向对象、集合(List、Map等),IO流,String/StringBuilder/StringBuffer、反射、多线程,这些最好是都要熟悉一些,面试也是重点。  JavaSE之后,如果你是要走前端或后端开发路线的话,可以跟着一些网上的视频继续学习,这里我就不多做介绍了。

===========分割线,Scala可以后续Spark阶段再接触学习=============

  Scala的学习,Scala是一门多范式 (multi-paradigm) 的编程语言,Scala支持面向对象和函数式编程,最主要的是后续Spark的内容需要用到Scala,所以前面学习了JavaSE,到Spark学习之前,再把Scala学习一波,美滋滋,而且Scala可以和Java进行无缝对接,混合使用,更是爽歪歪。后续Spark学习时基本都是用的Scala,也可能是和Java结合使用,所以Spark之前建议还是先学一波Scala,而且Scala用起来真是很舒服(wordcount一行代码搞定),适合迭代式计算,对数据处理有很大帮助,不过Scala看代码很容易看懂,但是学起来还是挺难的,比如样例类(case class)用起来真是nice,但是隐式转换学起来就相对比较难。学习Scala的建议:1. 学习scala 特有的语法,2. 搞清楚scala和java别,3. 了解如何规范的使用scala。Scala对学习Spark是很关键的(后面Flink也是要用),虽然现在很多公司还是用Java开发比较多,而且Spark是Scala写的,如果要读源码,会Scala还是很关键的(至少要看得懂代码)。  Scala主要重点包括:隐式转换和隐式参数、模式匹配、函数式编程。这里我看的是某硅谷韩老师的Scala视频,韩老师讲的真的很不错,五星推荐,哈哈。  也许有人会觉得Python也是需要的,但是学习阶段,可能用Java还是比较多,面试也基本都是问Java相关的内容,所以Python后续工作会用到的话,再看看Python的内容吧。

大数据框架阶段学习

  大数据这方面的知识点自己能够说真的是从零开始的,刚刚开始学那会Linux基本都没用过,心里那个虚啊,而且时间也紧迫,想起来都是一把辛酸泪。  刚刚开始学的时候,看了厦门大学林子雨的《 大数据技术原理与应用》课程,可能这个课程是面对上课的,所以看了一些,感觉对自己帮助不是很大(并不是说课程不好,可能不太适合自己,如果是要了解理论知识,很透彻,但是俺时间紧迫啊),所以就继续在网上找视频,然后发现某硅谷的培训视频很多人去参加,而且知识点也很齐全,大数据相关组件都有讲课,还有一些项目比较好,所以就找了它相关的视频,当时看的是2018年的,所以视频不算旧。  来一张推荐系统架构的图,先看看

  通常来说,Flume+Kafka对数据进行采集聚合传输,一方面Spark对实时数据进行处理,传输给相应的数据处理模块(比如实时数据处理的算法模块,Spark也有提供常见的机器学习算法的程序库),另外一方面采集的数据也可以放入数据库(HBase、MongoDB等)中,后续MapReduce对离线数据进行离线处理,数据处理完毕用于后续的使用,数据采集处理的流程大概就是这样。如果是推荐系统,实时推荐会给用户产生实时的推荐结果,让用户进行查阅选择,比如你在界面浏览了或者看了新的物品,然后刷新下界面,可能给你展示的东西就有一些变成跟你刚刚浏览的相关了。离线推荐的话主要是对离线数据进行处理,为物品或种类做出相似的推荐,如果后续用户搜索相应的物品时,给用户展示相应的产品。

  大数据学习路线:Linux -> Hadoop -> Zookeeper -> Hive -> Flume -> Kafka -> HBase -> Scala -> Spark -> 项目 - > Flink( 如果需要学习Storm,在Spark前面学习)

一、Linux(基本操作)

  一般我们使用的都是虚拟机来进行操作,所以要安装VM( Virtual Machine),我使用的是CentOS,所以VM和CentOS都要跟着安装好,跟着视频操作,一定要动手实践,将一些Linux基本命令熟练掌握,一些VIM编辑器的命令也要会用,做相应的一些配置,使用SecureCRT来做远程登录操作(也可以使用其他的,自己顺手就行)。再着重一遍,基本操作命令尽量熟练一点,如果一下记不住,打印一些常用的,自己看看,多用多实践,慢慢就会用了。还有一些软件包的下载安装卸载等,跟着操作一遍,熟悉下,后续都会使用,Shell编程可以后续补。

二、Hadoop(重点中的重点)

  Hadoop是一个分布式系统基础框架,用于主要解决海量数据的存储和海量数据的分析计算问题,也能够说Hadoop是后续整个集群环境的基础,很多框架的使用都是会依赖于Hadoop。主要是由HDFS、MapReduce、YARN组成。这个部分安装Hadoop,Hadoop的三个主要组成部分是重点,对他们的概念要理解出来,知道他们是做什么的,搭建集群环境,伪分布式模式和完全分布式模式的搭建,关键的是完全分布式的搭建,这些部分一定要自己动手实践,自己搭建集群,仔细仔细再仔细,Hadoop的NameNode,DataNode,YARN的启动关闭命令一定要知道,以及他们的启动关闭顺序要记住,不要搞混。后续视频会有一些案例操作,跟着写代码,做测试,把基本环境都配置好,后续这个集群(完全分布式需要三台虚拟机)要一直使用。

三、Zookeeper

  Zookeeper是一个开源的分布式的,为分布式应用提供协调服务的Apache项目。分布式安装ZK,对ZK有一定的了解就能了,了解它的应用场景,以及内部原理,跟着做一些操作,基本上有一些了解即可。

四、Hive(重点)

  Hive是基于Hadoop的数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。Hive的安装,它的数据类型,以及它的数据定义、数据操作有较好的了解,怎么操作表(创建表、删除表,创建什么类型的表,他们有什么不同),怎么操作数据(加载数据,下载数据,对不同的表进行数据操作),对数据的查询一定要进行实践操作,以及对压缩方式和存储格式要有一些了解,用到时不懂也可以去查,最好是能理解清楚。这部分有什么面试可能会问,所以视频后续的面试讲解可以看看,理解清楚。

五、Flume

  Flume是一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。对于Flume,对它的组成架构,以及对Flume Agent的内部原理要理解清楚,Source、Channel、Sink一定要知道它们的各种类型以及作用,有哪些拓扑结构是常见常用的,例如一对一,单Source、多Channel、多Sink等,它们有什么作用,要理解清楚。还有一个重点,就是对Flume的配置文件一定要了解清楚,不懂的可以上官网查看案例,对于不同的情况,它的配置文件要做相应的修改,才能对数据进行采集处理,视频中的实践案例一定要跟着做。

六、Kafka(重点)

  Kafka是一个分布式消息队列,用来缓存数据的。比如说实时计算中可以通过Flume+Kafka对数据进行采集处理之后,Spark Streaming再使用Kafka相应的Topic中的数据,用于后续的计算使用。对于Kafka,要理解Kafka的架构,什么是Kafka,为什么需要Kafka,应用场景。基础的命令行操作要掌握,比如怎么创建删除Topic,怎么通过生产者生成数据,消费者怎么消费数据等基本操作,官网也是有一些案例可以查阅的。

七、HBase(重点)

  HBase是一个分布式的、基于列存储的开源数据库。HBase适合存储PB级别的海量数据,也能够说HBase是很适合大数据的存储的,它是基于列式存储数据的,列族下面可以有非常多的列,列族在创建表的时候就必须指定。所以对HBase的数据结构要有一定的理解,特别是RowKey的设计部分(因为面试被问到过,咳咳,所以点一下),对于它的原理要了解,一些基本操作也要都会,比如创建表,对表的操作,基础的API使用等。

八、Spark(重点中的重点)

  Spark是快速、易用、通用的大数据分析引擎。一说到Spark,就有一种哪哪都是重点感觉,哈哈。  Spark的组成可以看下图

  Spark是基于内存计算的,对于数据的处理速度要比MapReduce快很多很多,而且数据挖掘这些都是要对数据做迭代式计算,MapReduce对数据的处理方式也不适合,而Spark是可以进行迭代式计算,很适合数据挖掘等场景。Spark的Spark SQL能够对结构化数据进行处理,Spark SQL的DataFrame或DataSet可以作为分布式SQL查询引擎的作用,可以直接使用Hive上的表,对数据进行处理。Spark Streaming主要用于对应用场景中的实时流数据进行处理,支持多种数据源,DStream是Spark Streaming的基础抽象,由一系列RDD组成,每个RDD中存放着一定时间段的数据,再对数据进行处理,而且是基于内存计算,速度快,所以很适合实时数据的处理。Spark MLlib提供常见的机器学习(ML)功能的程序库。包括分类、回归、聚类、协同过滤等,还提供了模型评估、数据 导入等额外的支持功能。对Spark的核心组件、部署模式(主要是Standalone模式和YARN模式)、通讯架构、任务调度要有一定了解(面试问到了能够说一波),Spark Shuffle要好好理解,还有内存管理要知道,对Spark的内核原理一定要好好理解,不仅面试可能要用,以后工作也是有帮助的。

九、Flink(重点中的重点)

  Flink是一个框架和分布式处理引擎,用于对无界(有开始无结束)和有界(有开始有结束)数据流进行有状态计算。现在主要是阿里系公司使用的比较多,很多公司使用的还是Spark居多,而且Flink基本上都是和Spark很多功能大体上一样的,但是以后Flink和Spark孰强孰弱还有待时间的考验,不过Flink近几年越来越火了这是事实,所以如果有时间有精力的话,可以学一学Flink相关的内容也是很不错的。Spark和Flink主要都是在数据处理方面应用,在数据处理方面的话,离线数据处理:Flink暂时比不上Spark,Spark SQL优点在于可以和Hive进行无缝连接,Spark SQL可以直接使用Hive中的表;Flink暂时做不到这一步,因为官方不支持这一操作,Flink只能将数据读取成自己的表,不能直接使用Hive中的表。对于实时数据的处理:Flink和Spark能够说是平分秋色吧,而且Flink是以事件为驱动对数据进行处理,而Spark是以时间为驱动对数据进行处理,在一些应用场景中,也许Flink的效果比Spark的效果还要好些,因为Flink对数据更加的敏感。比如一秒钟如果触发了成千上万个事件,那么时间驱动型就很难对数据做细致的计算,而事件驱动型可以以事件为单位,一个个事件进行处理,相比而言延迟更低,处理效果更好。现在使用Flink的公司越来越多,有时间学习下,也算是有个准备。

项目阶段

  其实某硅谷的视频里面有很多大数据相关的项目,而且都是文档配代码的,B站上也有视频,学习期间可以跟着视频做两到三个项目,自己理清思路,把项目理解透彻,还是可以学到很多东西的。  根据自己情况,选择两到三个项目重点跟着做,理解透彻一点

大数据项目实战

  某硅谷的视频里面有很多大数据相关的项目,而且都是文档配代码的,学习期间可以跟着视频做两到三个项目,自己理清思路,把项目理解透彻,还是可以学到很多东西的。根据自己情况,选择两到三个项目重点跟着做,理解透彻一点。相关项目文档资料我已经放到网盘,GongZhongHao回复相应关键字获取领取方式。   相关项目、涉及技术框架及其B站链接(B站链接主要是为了有些小伙伴网盘速度限制,这样就下载文档资料即可)

书籍

  书籍部分直接云盘链接保存即可,这里我放两张Java开发和大数据开发我自己的书单(很多,路漫漫,吾将上下而求索~)  Java后端书架:

  大数据书架:

  大概就这些,看完就需要很久了,大部分我也是需要的时候看相应的部分,所以有时间可以好好看下,不然就需要哪一部分看哪一部分,有助于学习即可。

最后

  大数据开发也是需要编程基础的,并不是学会使用这些框架怎么样就能了,所以对于编程语言,数据结构与算法,计算机网络这些基础也是要的,这些基础知识也有助于自己以后的发展,如果是应届生校招的话,面试基本上都是JavaSE和数据结构与算法等的知识点,还有大数据组件相关的知识点,以及对项目的理解,这些都是要自己面试前准备好的,多看面经,多找面试题看,面几次,心里有谱了,后续面试就好了。  不管是从事什么样的计算机相关的岗位,编程都是很关键的,数据结构与算法特别重要,还有就是leetcode等编程网站刷题,提升自己的编程思维,后续笔试面试都要要的。  要将一行行代码看做一叠叠rmb,但是一行行代码能不能转换成一叠叠rmb,自己就一定要:坚持,多敲代码;多敲代码,坚持;坚持。