在较为低迷的投融资大环境下,全球投资者对于 AI 的关注度有增不减。2021 年,全球 AI 初创企业融资破纪录达到 668 亿美元,是 2020 年融资总额的两倍之多。2022 年 Q1 相较于 2021 年 Q4 融资额下降了12%,但仍低于同期全球风险投资整体下降幅度。
新的一年,人工智能会朝着什么方向发展?CB Insights 提出了 2022 年值得关注的七大 AI 趋势。
合成数据,保护隐私
目前,由于 AI 技术呈指数级发展,变得更加先进,但其局限性仍然存在。例如,某些行业缺乏足够的真实数据来训练 AI 模型,又或者合规隐私成为一些行业技术发展的痛点。
企业纷纷开始部署 Synthetic data (合成数据),即由计算机人工生成的数据,可用于替代自现实世界中采集的真实数据集。
虽然有人质疑合成数据模拟真实数据的准确性,但仍有一些大公司将赌注押在了这项技术上。
illumina 正在使用由创业公司 Gretel 开发的合成基因数据进行医学研究。在一项联合研究中,两家公司均强调了,取得患者的知情同意权等举措限制了部分医学研究的速度和规模。Gretel 便使用真实的基因型和表型数据进行 AI 算法训练,生成人工基因组合成数据。
在金融领域,J.P. Morgan 正在利用合成数据训练金融 AI 模型。而在电信行业,由于无法获得客户同意,预计高达 85% 的真实客户数据无法获取,这给行为分析和预测造成了极大障碍。西班牙电信公司 Telefónica 与 Most AI 合作,模拟真实客户数据的统计模式,创建 GDPR 合规的客户合成数据档案。
今年早些时候,Meta 发表了一篇名为 “不同视觉模态都能通吃的杂食者”的论文,其中详细介绍了如果对一种 AI 模型进行识别 2D 图像的预训练,不经过额外的模态训练,该模型也能可以识别视频或三维图像中的南瓜。
多模态 AI 正在从实验室走到实际应用。例如,谷歌正在使用多模态 AI 来改进搜索体验。未来,如果用户上传了一张登山靴的照片,并附上“我能穿着这双靴子去富士山徒步旅行吗?”的文字,搜索引擎将识别上传的图像,从文本、图像和视频数据中挖掘网络上关于富士山的信息,并将这些琐碎的信息连接起来,提供一个贴切的答案。
多模态 AI 正在走出实验室,为搜索服务和内容生成等应用提供驱动力。
AI for AI
随着 AI 技术应用延展,企业正在寻求彻底改变现有的数据管理模式的解决方案,转向“AI 优先”策略。