账号:
密码:
CTIMES / 文章 /   
理解人工智慧:训练
 

【作者: Mark Patrick】2020年07月15日 星期三

浏览人次:【805】
  

人工智慧(AI)和机器学习是非正式使用术语,表示机器模仿人类进行知觉(perceiving)、推理(reasoning)和解决问题(problem-solving)等认知方面能力。籍由与人类似的「思考」能力,人工智慧在许多不同领域承担着多种任务。它的影像识别功能可?明进行医疗诊断和安全监视活动,语音辨识、翻译、新药出现和开发以及财务欺诈检测等也都属於AI范畴,而且这些仅是不断扩大应用领域中的一小部分。随着物联网(IoT)呈现指数级增长,人工智慧将在包括自动驾驶汽车、外科手术机器人和军用无人机等在内的IoT设备运作中起关键作用。


受到人脑启发,深度学习是一种机器学习,它将影像、语音或文本转换为数目,然後透过多层面数学操作来分析这些数目(因此称为「深度」)。在此过程中,分析层形成了概念层次结构或「思维」系统,可以分解输入,并识别潜在趋势或模式。深度学习在许多方面也与大脑背道而驰。例如大脑具有不同类型神经元和功能区,而机器学习目前只专注於以最高精确度对讯息进行归类。


学习过程

像人类一样,人工智慧在完成一项任务之前首先需要学习。人脑从外部线索中学习,以建立适用於解决之前尚未遇到过问题之思维系统。在机器学习方面,它是一种演算法,是一个解决问题过程,或是一组规则,从资料中学习然後生成模型(或一组叁数,如权重和偏差),这样可使将来问题的解决既高效又尽可能准确。本文将讨论如何训练机器进行「自学」。


许多类型机器学习可归为六大类:


?? 监督式学习


?? 迁移式学习(transfer)


?? 无监督式学习


?? 半监督式学习


?? 整体式学习(ensemble)


?? 强化学习(reinforcement)


监督式学习

如果学生在监督下学习,则老师需要确保学生学习正确且推理合理。类似,在监督式学习中,一种演算法学习一整套带有标记答案的资料,同时接收有关其解决方案准确性的连续回??。监督式学习对於归类或估计变数之间关系(回归,regression)的任务非常有用。其应用包括识别金融系统中可疑活动,以及面部、物体、语音、手势或笔迹识别等方面。


神经网路:每个神经网路包括一个输入层,一个或几个中间(或「隐藏」)层和一个输出层组成。神经网路是监督式学习的一个示例。影像、声音或文本等信号在输入层被转换为数目,然後在中间层和输出层进行处理。


卷积(convolutional)和复现(recurrent)是最常见的神经网路。卷积神经网路(CNN)从输入信号(影像或语音档)中提取特徵,同时保留这些特徵之间的空间关系以供进一步分析。CNN在电脑视觉工作(例如面部和语音辨识)中特别有效,非常适合於操作自动驾驶汽车。CNN影像识别能力在此对於识别附近其他车辆、行人或道路障碍物,以及提醒自动驾驶车辆前方任何潜在危险至关重要。


在复现神经网路(RNN)中,处理层的输出将回??到其所在的同一层,但这一次是作为校正输入。如果预测错误,则系统会在下次自我学习并改进预测。这种类型神经网路对於文本到语音转换非常有效。RNN主要用於长时间,内容丰富的输入,例如包含具有双重含义单词的句子(「crane」可能表示鸟类或建筑设备,具体取决於上下文),或者包含不同单词但却发音相同的音讯档(如「their」和「there」)。


最後,大规模和复杂任务可能需要模组化神经网路(MNN),它由以独立方式执行子任务的不同网路组成。透过独立运作,这些网路不会互相妨碍,从而提高了整体运算速度。


迁移式学习

监督式学习需要完全标记的大型资料集。但是,为每个特定应用组合大型完整资料集是一项挑战,而且通常不切实际。为应对完整资料集短缺问题,迁移式学习透过重用已经透过资料集训练模型(预训练模型)输入层和中间层来达到该目的,因此它只需要为新任务重新训练最後一层。预训练模型叁数将在开始时使用,然後在训练过程中进行调整以实现最高准确性。此外,透过避免从头开始训练所有层,迁移学习将显着缩短每种特定应用的总体训练时间。


有很多种预训练模型,其中最流行的包括用於物件实例分割的Mask R-CNN资料集,用於物件检测的YOLOv2,用於面部识别的VGG-Face模型,用於透过番茄成熟度而进行分类的Keras VGG-16模型,以及用於汽车分类的Stanford Car资料集等。虽然转移式学习解决了缺乏完整而独特资料集的问题,但它也具有某些缺点。这种学习必须缓慢进行,以避免失真,并且受预先训练资料集中预先存在叁数限制。


无监督式学习

在无监督式学习中,演算法尝试从一组未标记的资料中提取特徵,这些资料可以是具有各种属性的示例或信号,目的是在没有任何明确指令状况下找到基础模式。因此,无监督式学习在透过分组(聚类)确定要素或属性之间关联的任务中非常有用。例如了解关联可以?明根据客户以前购买习惯来预测客户可能还会喜欢什麽产品。无监督式学习可以根据一个人提出的问题以不同方式组织资料。因此,在无监督式学习中,提出正确问题,或以正确方式提出问题,这些都比在其他类型学习更为重要。


半监督式学习

在半监督式学习中,演算法使用部分标记的资料集进行训练。在此以CT扫描或MRI影像中肿瘤识别应用为例,由训练有素的放射科医师标记一小部分肿瘤,将大大提高演算法在无人监督下的准确性,从而改善诊断指标。


整体式学习

与透过单独使用任何一种演算法可实现的预测相比,整体式学习演算法结合了多种演算法以实现更准确预测。这种方法的一个着名应用发生在2006年Netflix大奖上,当时向竞争团队提供了一半用户对大量电影进行评级讯息的相关资料,目标是要弄清楚另一半用户如何评价同样的电影。获胜团队使用整体式学习方法击败了Netflix内部演算法。


强化学习

强化学习不断分析其环境中线索,以运算如何达到最隹下一步。强化学习主要应用大多是控制问题或游戏,如国际象棋或围棋。例如,在1990年代後期,IBM Deep Blue利用强化学习技术与世界象棋冠军加里·卡斯帕罗夫(Garry Kasparov)一决高下。然後在2018年,AlphaGo使用相同的方法击败了该游戏的顶级玩家之一Lee Sedol。


云端与边缘机器学习

传统上,用於工业应用的机器学习总是在物理资料中心或虚拟云端进行,并需要足够高处理能力和电力支援。但是,伴随物联网出现,这种模式正面临挑战。远离中央云端(因此位於「边缘」)的物联网设备不断收集大量资料。并将资料传输到中央云端以进行学习,然後重新部署到边缘。这不仅昂贵,而且非常耗时。相关时滞将使要求即时决策(或推断)的操作(例如自动驾驶汽车或军用无人机)无法进行。同样,资料传输可能会威胁到资料安全性和完整性。


解决此问题的一种方法是让机器学习运作在边缘。但是,该模型也有缺点。例如,物联网设备通常由小电池供电,并安装在难以补给(有时甚至不可能)的位置,因此能源供应是一个问题。另外,物联网设备提供的处理能力可能不足以进行机器学习。因此,如果要真正在边缘进行机器学习,就需要对硬体进行改进。本系列的第2部分将讨论工业以及IoT边缘机器学习的硬体要求。


(本文作者Mark Patrick任职於贸泽电子)


相关文章
数位分身不乏术 动员感测、资料分析与整合科技
5G与边缘互为体用 体现完美分散式运算
搜寻引擎下一波机会在哪里?
在物联网中添加【物】的六种方法
选定万用表的简单指南
comments powered by Disqus
相关讨论
  相关新品
EM500EV 测试/开发板
原厂/品牌:集博
供应商:集博
產品類別:IDE
  相关新闻
» 考古未来解密科技宝藏 互动体验拓展新视界
» 透视大脑:高阶脑部造影与转译研究新利器
» 工研院串联产官学研医 成立智慧长照大联盟
» 展现台湾生医能量实力 国际防疫共创新商机
» 韧性台湾推动後疫产业发展 工研院倡议转向智慧价值思维
  相关产品
» 贸泽电子供货Panasonic超低功耗PAN1762蓝牙低功耗5模组
» 贸泽供货Texas Instruments LMK05318网路时脉同步器 内建BAW谐振器
» 贸泽开始供应Maxim DS2477安全I2C协同处理器 可提供验证与实体安全性
» 贸泽供货TI DACx1416高电压数位类比转换器
» 贸泽电子4月新品精选 抢先引进新产品的全球代理商

AD


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2020 远播信息股份有限公司版权所有 Powered by O3
地址:台北市中山北路三段29号11楼 / 电话 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw