人工智能之核心基础 机器学习 第一章 基础概述
人工智能之核心基础 机器学习
第一章 基础概述
前言
1.1 什么是机器学习?(定义、核心思想、与传统编程的区别)
定义
机器学习(Machine Learning, ML)是一种通过算法和模型使计算机从数据中自动学习并进行预测或决策的技术,属于人工智能的一个分支。其核心目标是让计算机在没有明确编程指令的情况下,通过对大量数据的分析,识别模式和规律,从而构建适应新数据的模型。
Tom Mitchell的经典定义(卡内基梅隆大学计算机科学教授,机器学习奠基人之一):
"对于某类任务 T 和性能度量 P,如果一个计算机程序在 T 上以 P 作为性能度量的学习经验为 E,那么我们说这个程序从经验 E 中学习。"
用大白话解释:
任务 (Task, T):需要解决的问题(如垃圾邮件分类)经验 (Experience, E):提供的历史数据(成千上万已标注的邮件)性能度量 (Performance Measure, P):评估学习效果的指标(如准确率)核心思想
机器学习的核心思想是"数据驱动",即通过大量数据训练模型,让模型自动发现数据中的规律,而不是通过人工编写规则来解决问题。
与传统编程的区别
传统编程 | 机器学习 |
输入:数据 + 规则输出:结果 | 输入:数据 + 结果输出:规则 |
程序员需要明确指定所有规则 | 程序员提供数据,模型自动学习规则 |
适用于规则明确、结构化的问题 | 适用于规则模糊、复杂、数据驱动的问题 |
例如:计算个人所得税 | 例如:识别图片中的猫 |
1.2 机器学习的应用场景
生活案例
智能推荐系统:电商平台(如淘宝、京东)的商品推荐、视频平台(如抖音、爱奇艺)的内容推荐、社交媒体(如微信、微博)的信息流图像识别:手机相册自动分类照片、人脸识别解锁手机、拍照识物(如Google Lens)语音助手:Siri、Alexa、小爱同学等智能语音助手智能客服:网站上的自动客服机器人,能回答常见问题行业案例
行业 | 应用场景 | 价值 |
医疗 | 医学影像识别(癌症、肺结节)、药物研发、健康监测 | 提高诊断准确率,加速新药研发 |
金融 | 金融风控(识别欺诈交易)、量化投资、客户洞察 | 降低风险,提高投资回报 |
电商 | 个性化推荐、库存预测、用户行为分析 | 提升转化率,增加销售额 |
工业制造 | 预测性维护(设备故障预测)、智能质检(缺陷检测)、自动化生产 | 降低停机成本,提高产品质量 |
农业 | 耕地地块识别、作物病虫害监测 | 提高估产准确性,减少人工成本 |
具体应用案例:
高尔夫球场遥感检测:中科院遥感与地球研究所应用PaddlePaddle基于遥感数据进行语义分割,识别高尔夫球场,辅助国土资源管控深度学习质检一体机:大恒图像基于飞桨进行多种产品外观质检,场景迁移速度和检测效果显著提升钢铁熔炼生产工艺优化:精诺数据基于PaddlePaddle平台利用历史配料数据建模,优化配料方案,提升熔炼效率、节省原材料1.3 机器学习的分类
按学习范式分类
类型 | 定义 | 典型算法 | 应用场景 |
监督学习 | 有标签数据,学习输入与输出的映射关系 | 线性回归、逻辑回归、决策树、SVM、神经网络 | 分类(如垃圾邮件识别)、回归(如房价预测) |
无监督学习 | 无标签数据,发现数据内在结构 | K-means聚类、PCA、自编码器 | 聚类(如用户分群)、降维(如数据可视化) |
强化学习 | 通过试错与环境交互学习最优策略 | Q-learning、深度Q网络、策略梯度 | 游戏AI、自动驾驶、机器人控制 |
按任务类型分类
任务类型 | 目标 | 典型应用 | 评估指标 |
分类 | 将数据划分为不同类别 | 垃圾邮件识别、图像分类 | 准确率、精确率、召回率、F1值 |
回归 | 预测连续数值 | 房价预测、股票价格预测 | 均方误差(MSE)、平均绝对误差(MAE) |
聚类 | 发现数据中的自然分组 | 用户分群、市场细分 | 轮廓系数、簇内距离 |
关联规则 | 发现数据中项目间的关联 | 商品关联销售("购买啤酒的人也常买尿布") | 支持度、置信度、提升度 |
1.4 机器学习的发展历程与核心人物
发展历程
时期 | 时间 | 特点 | 代表人物/技术 |
热情期 | 20世纪50年代中期-60年代中期 | "无知识"学习,探索自组织系统 | 亚瑟·塞缪尔(Arthur Samuel)、感知机(Frank Rosenblatt) |
冷静期 | 20世纪60年代中期-70年代中期 | 研究人类概念学习过程,符号学习 | P.H. Winston、E.B. Hunt、R.S. Michalski |
复兴期 | 20世纪70年代中期-80年代末 | 专家系统兴起,统计学习理论发展 | MYCIN系统、ID3决策树、贝叶斯定理应用 |
繁荣期 | 20世纪80年代末-至今 | 深度学习爆发,大数据驱动 | 亚瑟·塞缪尔、杰弗里·辛顿、约书亚·本吉奥、杨立昆 |
核心人物
亚瑟·塞缪尔(Arthur Samuel):1959年提出"机器学习"一词,设计了首个能学习下棋的程序杰弗里·辛顿(Geoffrey Hinton):深度学习先驱,2018年图灵奖获得者约书亚·本吉奥(Yoshua Bengio):深度学习三巨头之一,2018年图灵奖获得者,2025年发起非营利组织LawZero杨立昆(Yann LeCun):卷积神经网络(CNN)创始人,2018年图灵奖获得者1.5 初学者学习路径与工具准备
学习顺序建议
阶段1:夯实基础
数学基础(优先级:统计 > 线性代数 > 微积分)统计:均值/方差、概率分布、假设检验线性代数:矩阵运算、向量空间微积分:导数、梯度概念(理解梯度下降即可)编程基础Python基础语法NumPy、Pandas、Matplotlib库阶段2:掌握核心概念
机器学习类型:监督学习、无监督学习、强化学习关键术语:特征工程、过拟合、交叉验证、损失函数经典算法:线性回归、逻辑回归、KNN、决策树、SVM、随机森林阶段3:实战项目
从简单项目开始:鸢尾花分类、房价预测逐步过渡到复杂项目:图像分类、文本情感分析参与Kaggle竞赛,提升实战能力必备工具清单
工具类型 | 推荐工具 | 用途 |
开发环境 | Anaconda + Jupyter Notebook | 集成开发环境,方便代码编写和可视化 |
编程语言 | Python | 机器学习最常用语言 |
机器学习库 | Scikit-learn、TensorFlow、PyTorch | 提供丰富的机器学习算法实现 |
云平台 | Google Colab、Azure ML | 提供免费GPU资源,方便运行大型模型 |
数据处理 | Pandas、NumPy | 数据清洗、处理和分析 |
可视化 | Matplotlib、Seaborn | 数据可视化,帮助理解模型结果 |
学习资源推荐
入门书籍:《机器学习实战:基于Scikit-Learn和TensorFlow》《统计学习方法》(李航)《深度学习》(花书,Goodfellow等)在线课程:Coursera《机器学习》(Andrew Ng)Microsoft Learn《创建机器学习模型》3Blue1Brown的"线性代数"、"微积分"系列视频实践平台:Kaggle(数据科学竞赛平台)Google Colab(免费Jupyter Notebook环境)本章小结
机器学习作为人工智能的核心技术,已经从理论走向实际应用,深刻影响着我们的日常生活和各行各业。本章我们介绍了机器学习的基本概念、应用场景、分类方法、发展历程以及初学者的学习路径。理解这些基础知识,将为后续深入学习机器学习算法和应用奠定坚实的基础。记住,机器学习的核心是"数据驱动",通过大量数据训练模型,让计算机自动发现规律,从而解决实际问题。
资料关注
公众号:咚咚王 gitee:
https://gitee.com/wy18585051844/ai_learning

《Python编程:从入门到实践》
《利用Python进行数据分析》
《算法导论中文第三版》
《概率论与数理统计(第四版) (盛骤) 》
《程序员的数学》
《线性代数应该这样学第3版》
《微积分和数学分析引论》
《(西瓜书)周志华-机器学习》
《TensorFlow机器学习实战指南》
《Sklearn与TensorFlow机器学习实用指南》
《模式识别(第四版)》
《深度学习 deep learning》伊恩·古德费洛著 花书
《Python深度学习第二版(中文版)【纯文本】 (登封大数据 (Francois Choliet)) (Z-Library)》
《深入浅出神经网络与深度学习+(迈克尔·尼尔森(Michael+Nielsen)》
《自然语言处理综论 第2版》
《
Natural-Language-Processing-with-PyTorch》
《计算机视觉-算法与应用(中文版)》
《Learning OpenCV 4》
《AIGC:智能创作时代》杜雨+&+张孜铭
《AIGC原理与实践:零基础学大语言模型、扩散模型和多模态模型》
《从零构建大语言模型(中文版)》
《实战AI大模型》
《AI 3.0》
上一篇:可控核聚变进入产业化前夜
大家都在看
-
0博士组合拿下ICLR时间检验奖,十年论文终封神 鹭羽 发自 凹非寺量子位 | 公众号 QbitAIICLR 2026时间检验奖新鲜出炉,获奖者——GPT天才本科生Alec Radford。网友们纷纷送来祝贺:“实至名归!”Alec为人相当低调,其社媒清一水的都是转发推荐他人优秀成果。但实 ... 机械之最04-26
-
追光丨专属老年人的“神仙”健身房 你看了“心动”吗? 放眼全国大大小小的健身房早就遍地开花但专门给老年人开的健身房你见过吗?不是公园随便甩甩手也不是小区慢悠悠走两圈而是有专业设备、有运动方案、有指导人员的专业空间一进门先做“全身扫描”↓机器一测个性化运动 ... 机械之最04-26
-
2026北京车展,中国智驾正定义全球标准 编者的话:在全球汽车产业的重心开始向东方倾斜之际,一场规模空前的行业盛宴在北京启幕。4月24日至5月3日,2026北京国际汽车展览会以“世界最大规模车展”的姿态,为全球观众和展商展示汽车技术创新的高地。正如一 ... 机械之最04-26
-
关注“体验经济”丨每年十几万人打卡“小米工厂” 工业游何以这么火? 新华社北京4月25日电 题:每年十几万人打卡“小米工厂” 工业游何以这么火?新华社记者吉宁看流水线上的机械手臂上下挥舞,亲手触摸机械零件实物,一趟行程下来仿佛置身科幻大片,近距离感受中国制造的魅力……近一 ... 机械之最04-26
-
机械键盘选购指南:不同预算怎么选,才能不踩坑? 2026实战版买机械键盘踩坑的人,不是因为买贵了,而是买错了。有人花800块买青轴,室友差点搬家。有人冲着"磁轴"跟风,到手才发现自己根本不需要那么高的触发精度。键盘看着就是一块板子加一堆键帽。但选错 ... 机械之最04-26
-
机械专业报考建议:在质疑声中看清“工业之母”的真正价值 如果你去知乎搜索机械专业,画风大概是这样的:“快跑”、“天坑”、“生化环材机械土木”、“提桶跑路”。在这些焦虑的表达背后,我们需要冷静地问一问:机械专业真的已经过时了吗?为什么每年仍有数十万考生选择这 ... 机械之最04-26
-
星箭聚力 探秘海南超级工厂 四月二十四日是第11个中国航天日,今年也是中国航天事业创建70周年。从“东方红”奏响太空,到“嫦娥”揽月而归,中国人已经将飞天梦想写进了星河。如今,商业航天正像雨后春笋般涌现,成为航天版图中的新兴力量。20 ... 机械之最04-25
-
半夜收到一条私信:陈老师,我家孩子985机械电子,校招月薪5500 图片来源网络昨晚快十二点了,后台弹出来一条私信。很长,我看了一遍,又看了第二遍。“陈老师,孩子某985机械电子工程,今年大四,秋招拿了三个offer,最高的一个5500,在郊区。我当时给孩子选这个专业,就是看它名 ... 机械之最04-25
-
仅次于东道主!约700家中国展商亮相汉诺威工博会 原标题:汉诺威工博会展示工业AI新场景(国际视点)参观者在西门子展台观看机械臂抓物演示。本报记者 郭梓云摄中联重科展出的人形机器人表演太极,吸引众多参观者围观。本报记者 刘仲华摄形态多样的人形机器人跑跳坐 ... 机械之最04-25
-
央视曝光全球最强光刻机:西方封锁十年,中国早已另起炉灶 画面里,250个重型集装箱在深夜的厂房里有序落地,工人们像拼巨型积木一样,把这些箱子一点点合拢、组装。最后,一台180吨重、造价4亿美元(约29亿人民币) 的工业巨兽,完整地出现在世人面前。这就是荷兰ASML公司的 ... 机械之最04-25
相关文章
- 机械设计“进化史”从古代水车到智能机器人,藏着人类的造物智慧
- 机械专业报考建议:在质疑声中看清“工业之母”的真正价值
- 星箭聚力 探秘海南超级工厂
- 一场田间的“精密大考”——天津“优机优补”赋能合作经济一线观察
- 半夜收到一条私信:陈老师,我家孩子985机械电子,校招月薪5500
- 仅次于东道主!约700家中国展商亮相汉诺威工博会
- 央视曝光全球最强光刻机:西方封锁十年,中国早已另起炉灶
- 工业母机的“两岸配方”
- 机械大学生能考哪些证书?2026年高质量就业考证指南与职业规划
- 被机械设计“拯救”的3个日常瞬间,原来它一直在默默帮我们省事
- 为沙漠钉“楔子”——千里河西治沙行
- 商业航天,加速“飞天”(大数据观察·航天日特别报道)
- 毫秒级精准复刻人类动作——人形机器人有了“通用小脑”
- 高考填志愿:机械类这三个专业怎么选?看完这篇不再纠结
- 爷爷的老座钟,藏着机械设计的“老智慧”,用了50年还在走
- 从“仰望星空”到“产业升空”——解码商业航天的中国式强国之路
- 统一后的台湾机械厂是沦为平庸还是涨薪?解析两岸合并后的红利!
- 五十年代尚无人工智能,毛主席早已提出机器替代人脑劳动
- 首席记者谈首季经济丨透过中欧班列,看见中国经济开放活力
- 西安交大在第十二届全国大学生机械创新设计大赛慧鱼组竞赛中获8项一等奖
热门阅读
-
天下第一暗器暴雨梨花针,传说中的唐门暗器做出来了 07-13
-
汽车投诉排行榜前十名汽车 问题最多的就是这些车 07-13
-
世界上最牛挖掘机,甚至可以挖穿一座城市 11-05
-
世界最大核潜艇制造厂,产量远超中美法 11-20
