■本报记者 徐晶卉 张天弛
【资料图】
从识别甲骨文到辨认难度系数更高的钟鼎文,写诗、作画的艺术修养也大大提高;网络诈骗陷阱面前,“反诈盲盒”层层“解套”更加聪明……2022世界人工智能大会今天拉开帷幕,让我们一起来看看,一年不见,人工智能(AI)又长了哪些新本事?
亮点一:AI识别西周钟鼎文
还记得去年世界人工智能大会上大火的甲骨文识别吗?今年大会上,智能文字识别技术被应用到了难度更高的钟鼎文(金文)识别上。
在合合信息展位,“C位”是一个古鼎,凹凸不平的古鼎内壁刻着两段“看不懂”的文字。记者按下拍摄键,古鼎里的照相机聚焦文字后拍照,将画面投射到大屏幕上。然后,神奇的事发生了,在没有人工干预的状态下,鼎内文字从内凹状态被拉平,并被转译成简体字。此后,“克曰穆穆朕文且師華父悤譲氒心宁静于猷淑哲氒德”等原本连在一起的古文语句,也经过“AI断句”功能自动处理后被区分开来。工作人员介绍,这段鼎文翻译出来大致意思是,家中祖父得到鼎的由来故事。
在钟鼎文的处理过程中,智能文字识别的关键“技能点”都被包含其中,包括以“弯曲矫正”为代表的智能图像处理、基于深度学习的复杂场景文字识别、自然语言处理(NLP)等。工作人员介绍,这些技术在现实生活中有很多应用场景,“现阶段,图像处理在不同场景存在着文档图像质量退化严重、文字检测及版面分析困难、非限定条件文字识别率低等问题,智能图像处理技术可对复杂场景下的文档图像进行高效而精准的处理”。
亮点二:神笔AI一语成画
AI写诗、作画、配文?在百度飞桨专设的AI创意体验区,记者体验了一把“人人都是艺术家”,在手机里输入“瓦尔登湖”,点击“立即生成”,大屏上就开始显示作画过程,像打印下载一样生成一幅唯美画作。再点击应用,画面上还会出现客厅画框背景、抱枕、T恤衫等场景的模样。
不仅能创作全新的画作,这位“神笔马良”还能“补全”黄公望的传世佳作《富春山居图》。这幅名画由于中间部分已损毁,现存的两幅残卷难以一览全貌。记者在现场体验了《富春山居图》的“虚拟补全”,在两幅残卷的中间随意画上几笔山水、房屋,点击“AI生成”,一秒就可实现山水相连,而且基于对于名画的研究和数据积累,AI补全的部分甚至可以做到与现存画卷风格统一,画中的山水脉络也和谐流畅。
“一语成画”“补全名画”为何能轻松实现?工作人员揭秘,这来自百度刚刚发布的AI艺术和创意辅助平台“文心·一格”,而后者则基于飞桨文心大模型的文生图系统实现了产品化创新。人工智能在艺术领域的学习与创作能力正以蓬勃之势不断刷新我们的认知,同时也让科技、艺术及文化的融合创新有了更大的想象空间。
亮点三:“反诈盲盒”层层“解套”
走进蚂蚁集团展台,一款“反诈盲盒”吸引了很多人的注意。记者随意选择了一个盲盒,弹出的是一段绘声绘色的校园贷视频,视频最后弹出一个提示转账的二维码。离骗子得逞只剩一步之遥,此时,技术手段帮上了忙。当记者模拟扫描二维码,在输入密码转账的瞬间,手机上立刻收到了一个来自反欺诈中心的客服电话,电话那头的“AI叫醒机器人”会仔细询问交易商品信息、交易平台名称等,并提醒记者有被骗风险。
如果消费者执意选择支付,技术人员还新开发了“15分钟冷静期”和“24小时延时到账”的功能,前者通过主动暂停风险交易,给用户核实和再次选择的时间窗口;后者则相当于交易反悔期,意味着用户在24小时内还有将风险资金追回的可能。
“反诈盲盒”互动产品的原理源自蚂蚁集团自研的“智能风险感知与响应联合反诈系统”。工作人员介绍,这套智能反诈系统基于交互式风控、全图风控、可信人工智能等技术突破,可实现事前异常感知、事中识别和干预、事后智能处置的风控自动驾驶和跨行业联防联控,已为全球超10亿用户、每天上亿笔交易提供安全保障。
亮点四:元宇宙里社交“第一步”
不露脸也能社交?这在一款名为灵犀(Soul)的App上是可以实现的。记者在WAIC元宇宙展区上海任意门科技有限公司展台看到,一个个顶着各式各样面具、头套的用户在分享着自己的照片和短视频,有的是卡通美少女、有的是京剧脸谱,还有独角兽、小老虎等动物形象,有趣的是,这些“假面”能够传神地还原真人的表情和神态。
“这些都是用户自己‘捏脸’制作的虚拟形象,”工作人员告诉记者,“捏脸”功能是基于灵犀App自主研发的“NAWA”引擎实现的。而能够栩栩如生地呈现用户的神情,则是因为在采集信息时使用了大量算法,能够识别用户丰富的表情,“例如,对于眨眼、吐舌、鼓腮等这些微表情,NAWA都能够精细化识别和进行联动”。
亮点五:城市有了“孪生兄弟”
数字孪生是物理世界与数字世界之间的虚实映射与驱动控制,在千寻位置展台,首次展示了具备精准时空能力的数字孪生产品,包括面向数字孪生的3D地图引擎“千寻数境”、道路智能巡检系统“千寻驰观”、数字孪生基础设施管理平台“千寻孪界”等,可助力构建实时精准映射现实环境的“数字孪生”城市。
记者在现场看到,此次展出的“千寻孪界”,基于高精度统一时空基准还原基础设施的位置、姿态等时空信息,支持实时感知数据在虚拟世界同步投射。管理人员可以回溯任意时空场景可感知的人、车、物及事件,完成基础设施全生命周期精细化管理。
“更精细化的数字孪生能力,是实现时空智能的基础。”千寻位置CEO陈金培表示,只有精准映射,物理城市与数字城市才能紧密融合、双向互动,从而实现各类时空智能应用。
现场还展示了智慧交通、智能驾驶、数字城市等案例。比如,在道路养护领域,传统巡检过程中通常存在自动化程度不高、算法识别准确率不高、数据重复、采集覆盖范围有限等问题。而通过“千寻驰观”,只需1名司机,即可采集三车道道路情况,支持典型道路病害及设备设施的边缘侧智能识别,识别准确率优于90%,可大幅提升日常巡检的作业效率,降低作业人力成本,还能为道路巡查提供辅助决策支持。
资讯推荐