Data Science & Machine Learning

什么是机器学习(ML)？了解其机制和影响

Retainna Lin

Apr 17, 2024 • 6 min read

在科技不断发展的时代，突破性的概念不断改变数位世界：机器学习（ML）。透过我们的综合指南，揭开机器学习的秘密。深入了解什么是机器学习、机器学习的工作原理及其对各行各业的变革性影响。

什么是机器学习？

机器学习是人工智慧的一个分支，其核心是创建具有从资料中学习能力的演算法，然后利用这些知识来产生预测或判断。开发这样的演算法是为了完成人类无法完成的任务，包括在庞大的资料库中筛选隐藏的模式和洞察力。

机器学习如何运作？

机器学习的一个主要目标是让电脑有能力在没有人类干预的情况下学习和成长，以应对新的数据和情况。机器学习演算法从资料样本中建立模型，而不是依靠预先编程的规则来得出结论或预测。人类要手动发现机器学习能够发现的模式和相关性，即使不是不可能，也是极具挑战性的。影像辨识、推荐系统、预测分析和自然语言处理只是从中受益的众多应用中的一小部分。

机器学习有哪些不同类型？

机器学习领域存在许多不同的方法，每种方法都有自己的特点和实际用途。我们可以了解以下主要类型：

监督学习

监督学习是指使用标注资料集中已定义的输入和输出来训练演算法。目的是找出如何接收资料并利用资料产生标签和输出值。有了这些训练，演算法就能产生预测结果，而且每次迭代都能更好地做出准确预测。

*代表性演算法：线性回归、逻辑回归、决策树、随机森林、支援向量机、神经网路。

无监督学习

与监督学习不同，无监督学习使用未标记的原始资料。对于聚类或关联等任务，这是指演算法自主努力在资料中寻找模式和关联性。

*代表性演算法： K 均值聚类、层次聚类、主成分分析（PCA）、关联规则。

半监督学习

半监督学习是一种结合了监督学习和非监督学习的方法。当取得标记的资料集成本太高或不切实际时，这种方法就派上用场了。

*代表性演算法：自我训练、协同训练、生成模型、基于图形的方法、低密度分离

强化学习

强化学习中的演算法在激励和惩罚的帮助下，透过实践来学习。游戏、导航和即时决策都会用到这类演算法。

*代表性演算法： Q-learning、策略梯度、深度Q网路。

深度学习

深度学习是机器学习的一个分支，拥有众多层级的神经网路被用于深度学习。这些层能够学习更抽象的数据，从而大大提高了图片和语音辨识等复杂任务的效率。

*代表性演算法：人工神经网路（ANN）、卷积神经网路（CNN）、循环神经网路（RNN）、自动编码器。

如何选择并建构正确的机器学习模型

在选择和开发机器学习模型时,需要遵循一定的系统流程。首先要充分了解问题本质、预期目标、以及资料的特征。资料清洗、特征工程,并将资料分为训练集、验证集和测试集是预处理的重要环节。演算法的选择要考虑问题性质、资料特征以及对速度、可解释性等方面的需求。建立合适的评估指标,在训练集上训练模型。透过调整超参数、正则化方法和交叉验证等措施来避免过拟合,以获得最佳性能。尝试不同演算法或整合方法往往能进一步提升效能。

当模型性能令人满意后,可将其投入生产环境,密切监控在实际场景中的表现,必要时进行相应调整。同时要详细记录所有决策、实验和结果。在模型选择之前,还需考虑现实世界中的运算能力、可扩展性和部署需求等限制条件。建构有效的机器学习解决方案需要采取迭代式的策略,结合领域知识和系统性评估。

机器学习的优缺点

下表列出了机器学习的优点和缺点：

*「黑盒子」模型指的是那些内部运作机制不透明、难以理解的模型。这种模型可以产生预测或决策，但是其决策过程难以追踪，因此外部观察者难以解释模型的具体行为和输出原因。

业界的机器学习实例

机器学习正在对众多行业产生深远影响。透过更好的病人诊断、预测分析和量身定制的治疗方案来改善医疗保健。在金融领域，它被用于检测诈欺、自动交易和风险评估。在行销领域，ML 为客制化广告、消费者细分和消费者行为预测分析提供了动力。

机器学习的未来

深度学习、无监督方法、多模态模型的进一步发展，以及强化学习的突破，都预示着机器学习的美好未来。多模态学习模型的广泛应用将使人工智慧的改进成为可能。这些模型可以整合多种模式的处理和学习，如文字、图像、音讯等。

机器学习必将彻底改变各领域，推动各类公司的创新。尽管存在一些障碍，但该领域正在取得长足进步，未来将实现革命性的技术发展，并解决复杂的难题。