机器学习初学者最常见的5个误区

作者|ZOMI酱
来源|知乎
避开机器学习初学者最常见的5个错误
在这篇文章中,我们将看到学习Machine Learning时最常出现的 5 大错误。我相信每个人都可以入门的时候就很好地使用机器学习算法。希望这篇文章能够帮助大家避开或解决大家学习和实践中的一些错误。尽量避免跳坑。
1、 不要从理论开始入手
传统的机器学习教学是这样的:
努力掌握数学背景知识努力学习机器学习理论努力从头开始实现算法自我感觉不错(一些神奇事情发生)最后开始使用机器学习(我们的终极目标)这种方法非常慢,而且很困难。这是为想要拓展该领域前沿的学者设计的,并不适合只是想要得到结果的实践者。
Trap
如果你在想以下问题,你就掉入了这个坑了:
我需要先完成线性代数的课程;我需要回去先拿个博士学位;我必须先读完教科书。Way out
数学或深奥的算法理论学习能够怎样帮助你实现目标?你多半会停下来。会失败。不会离你的目标更进一步。解决的方法是鼓捣模型。
如果机器学习对市场的有价值的贡献是准确的预测,那么你就学习对问题进行建模并得出准确的预测吧。就从现在开始!
然后努力掌握它,做到非常擅长。
如果你需要,就阅读、窃取、收割别人的理论,但你只需要你的目标所需要的——只要它能帮助你实现更好的价值。
2、不要学习所有的机器学习算法
机器学习是一个非常大的研究领域。它是指计算机学习过程的自动化,与人工智能有很大的交叠。从深奥的学习理论到机器人技术——这个领域的范围非常广。你不可能将它们整个拿下。
Trap
如果你在想下面这些,你就落套了:
我需要学习一个新网站上提到的每一种新技术;首先我需要学习计算机视觉、自然语言处理、语音等等;我需要了解每项技术的每个方面。Way out
选择一个小方向并且保持专注,然后进一步收窄。机器学习中最有价值的领域是预测建模——创建数据的模型以做出预测。
接下来,专注于一种与你最相关或你最感兴趣的预测建模,然后保持专注。也许你是根据技术选择的(比如深度学习),也许你是根据问题类型选择的(比如推荐系统);也许你不确定,只是随便选了一个。不管怎样,努力掌握它或至少做到精通。
接下来才开始进入下一个领域。
3、不要在算法上花费太多时间
机器学习实际上就是算法,而算法实在太多。每一个算法都是一个复杂的系统而且拥有自己的小研究领域和生态系统。可以选择将自己迷失在算法之中,这么做的人被称为学者。
Trap
如果你在说这些,你就已经在陷阱里了:
在我使用它之前我需要知道它的工作原理;我首先需要深入理解超参数;在进行微调时,我需要解释其因果关系。Way out
算法并非结果,它们只是实现结果的方法。事实上,机器学习算法是一种商品。
多实践!不断地换不同的算法,在问题上实验各种各样的算法。对其中一些进行调节,但不要把自己困在这一步。
使用一个系统过程(systematic process)。设计调试实验并将它们的执行和分析自动化。
机器学习的关键是好好利用算法,而应用算法不只是研究算法本身。
我们的目标应该是为每一个项目得出一个结果——一组预测或一个能给出预测的模型。
4、不要从头开始实现所有东西
从头开始实现算法能够教会你很多东西。但有时候需要实现一项技术,因为没有合适的或可用的实现。但是,通常来说,你不一定要也不应该这么自己实现算法。
这样做就跳坑里去了,大部分时候事实是这样的:自己实现的结果很糟糕。
有各种漏洞速度很慢吃内存无法很好地解决边缘情况甚至可能是错的Trap
如果你在做下面这些事,你已经掉入陷阱了:
你在编写载入 CSV 文件的代码(搞什么鬼!?用panda!);你在编写线性回归这种标准算法的代码;在编写用于交叉验证或超参数调整的代码;Way out
别折腾了!
使用一个已被成千上万的开发者所使用过的能够处理所有边缘情况的库,众所周知它是正确的;使用一个经过了高度优化的库,它能充分利用你的硬件的每一个计算周期和你的内存的每一个字节;为你的项目使用一个图形用户界面,从而完全避开代码;每次都自己实现你想要使用的算法是非常缓慢的入门机器学习的方式。如果你是为了学习而实现它们,那么就要对自己诚实:你的实现还不够好,你不能通过这样应用机器学习来带来价值。
5、不要总改变使用的工具
目前有很多的很棒的机器学习工具。事实上,很棒的工具加上数据的可用性和更快的硬件使得机器学习的复兴成为了可能。但你可能陷入这样一个坑中:跳入每个你偶然发现的新工具中。
Trap
如果发现自己符合以下三点那你就陷入了该陷阱中:
使用每个你听到过的新工具发现自己每周或每个月都学习一项新工具或语言学习一个库时半途而废并转向新的库
Way out
有规律的学习和使用新工具,在解决实际问题时融合不同的工具。选择一个主要的大型平台并坚持使用它,那在解决机器学习问题时会更加高效,至少也要足够精通该平台。
这里我推荐 3 个的平台:Weka; Python; R
总结
不要从理论开始入手
不要学习所有的机器学习
不要在算法上花费太多时间不要从头开始实现所有东西不要总改变使用的工具本文不太赞成自己真真正正地从头到尾学习去自己实现一个算法,例如向后传播BP算法,也不赞成从数学底层地角度去理解为什么梯度下降有效、如何操作才能减少梯度发散的等高深莫测的数学问题。对于一个工程上的问题,我们需要的是解决问题、达到目标,实现价值,这是针对工程应用的。
对于个人的能力的提升,是需要去不断地学习、应用、实践再回归学习的一个epoch循环。如果我们不理解推荐系统的协同过滤算法,跟吃瓜的群众一样:“根据历史的数据去匹配一个跟我相似的用户”这样的说法,那么就太吃瓜了。
ABOUT 关于我们 深蓝学院是专注于人工智能的在线教育平台,已有数万名伙伴在深蓝学院平台学习,很多都来自于国内外知名院校,比如清华、北大等。大家都在看
-
颜值即正义 五款长在审美点上的硬核轻武 哪一把是你的梦中情枪? 在冰冷的钢铁世界里,武器从来不仅仅是冰冷的杀戮工具。当精密的机械逻辑碰撞上极致的工业设计,这些由钢铁与火药淬炼而成的造物,便升华成了让无数人痴迷的艺术品。有那么五款名枪,它们跨越了时代的硝烟,仅仅凭借 ... 机械之最03-15
-
机械铸魂 铁路传薪——探访北京交通大学大学生机械博物馆 神州高铁模型与穿隧道变位平台运架一体机电影放映机光学经纬仪世界上独一无二的八音盒志愿者亲手复原的纺车美国早期马鞍形车床穿隧道变位平台运架一体机国产自动号码机、美国产打票机双筒望远镜打字机墙手摇计算机群 ... 机械之最03-15
-
从鸡舍到餐桌,一枚让人放心的鸡蛋要经过几道关? 数据来源:国家蛋鸡产业技术体系清晨,百姓餐桌上,白煮蛋冒着热气;餐饮店后厨内,鸡蛋煎炒烹炸出家常美味;烘焙间里,金黄色蛋液被均匀打发……鸡蛋,中国人餐桌上不可缺少的主角之一。而今,中国人的买蛋习惯正在 ... 机械之最03-15
-
记者“养虾”手记:体验五天,发现目前“龙虾”并不适合普通用户 记者使用AI生成。近期,“养龙虾”热潮来袭,不少用户在“FOMO(害怕错过)”情绪下涌入“养虾”市场,甚至不惜花钱也要部署OpenClaw。“龙虾”究竟好不好用?有多“费钱”?是否会泄露隐私?对此,新京报贝壳财经记 ... 机械之最03-15
-
机械五虎谁能称王?清华、哈工大硬刚985,这些名校分化有多猛 如果你家孩子问机械工程要读哪,很多人估计第一反应就是清北、哈工大吧。但真想好报志愿,光看985还是211没啥用,要深挖里面的门道。现在全国能发机械工程博士学位的高校,加起来一共有93所,更别说还有189所学校搞 ... 机械之最03-15
-
亮黑伯莱塔92X 意式优雅与战术美学的碰撞 黑曜石般的钢铁艺术 在手枪设计的漫长画卷中,伯莱塔(Beretta)始终是那个能够将致命武力与艺术美感缝合得严丝合缝的工匠。如果说经典的92FS是身披迷彩、立下赫赫战功的沙场老兵,那么亮黑版伯莱塔92X则是走进二十一世纪的现代精英。它 ... 机械之最03-15
-
2026广西机械类报考:哪所大学就业最香?最新录取数据曝光! 各位家长、同学好,我是专注广西高考报考的指导老师。这几天咨询群里,机械类专业的热度很高。确实,机械是工业的基石,从汽车制造到智能装备,从工程机械到机器人,机械类人才的就业面非常宽。但问题来了:广西开机 ... 机械之最03-15
-
夜读丨这只被全网心疼的小猕猴,让我们看到拥抱的意义 近日,一只名叫Punch的小猕猴在网络中走红。它刚一出生就被母亲抛弃,不被猴群接纳,玩耍时甚至被同类殴打,公园管理员没办法,只得给它一个毛绒猩猩玩偶作为“母亲”的代替品。Punch无论走到哪,都抱着那只毛绒猩猩 ... 机械之最03-15
-
机械类专业别乱选!12个热门方向全梳理,就业好坏一眼看清 高考填报志愿打算选机械方向的考生和家长,一定要先弄清楚专业差异!很多人以为机械都是一样的,实际上不同方向未来就业、薪资、发展天差地别,有的进大厂拿高薪,有的只能做传统技工。今天把机械类最实用的专业方向 ... 机械之最03-15
-
“龙虾”接管电脑的5分钟里,他的电脑被陌生人连了139次 “保护环境。”当你给AI发送这样一条极度简单、语义模糊的指令后,你期待它给你怎样的回应?解释环保的概念?给出保护环境的建议?慷慨激昂地发表一番绿色地球宣言?如果它没做这些,反而是悄无声息地删掉你一部分文 ... 机械之最03-13
相关文章
- 2026广西机械类报考:哪所大学就业最香?最新录取数据曝光!
- 夜读丨这只被全网心疼的小猕猴,让我们看到拥抱的意义
- 机械类专业别乱选!12个热门方向全梳理,就业好坏一眼看清
- “龙虾”接管电脑的5分钟里,他的电脑被陌生人连了139次
- 【史海回眸】泰缅“死亡铁路”,日军暴行铁证
- 第51届日内瓦国际发明展开幕 中国参展规模创新高
- 云深处科技的机器马有何特别之处
- 来时的路(一):第一机械工业部,那个管得最宽的“一机部”
- 独家!探秘创下五大“世界之最”的中国深海“蛟龙”
- 火骨纸魂、跃夜成光,五经富烟花火龙非遗重生全记录
- 世界肾脏日
- 商鞅变法,最狠的改革,把弱秦变成战争机器
- 向新求质 三明工业稳健前行
- P08炮兵型 当优雅鲁格遇上长枪管 它是手枪界的“狙击精英”
- 对比多家裁断机供应商,最终还是选智成!原因很实在
- Nikon FM2:机械之心,永恒之魂
- 经常挖鼻孔,后来都怎么样了?有这种情况的人真的要注意了
- 别再盲目劝退机械!大学生选对这几个方向,越老越吃香薪资节节高
- “封龙”何以变“飞龙”——石家庄五大产业跃升记
- “6G网要来了”热搜第一!研发进入关键期,还要破解哪些难题
热门阅读
-
天下第一暗器暴雨梨花针,传说中的唐门暗器做出来了 07-13
-
汽车投诉排行榜前十名汽车 问题最多的就是这些车 07-13
-
世界上最牛挖掘机,甚至可以挖穿一座城市 11-05
-
世界最大核潜艇制造厂,产量远超中美法 11-20
