美图影像研究院的研发人员正在进行相关生成式人工智能产品的开发
黑镜科技的技术人员正在进行AI数字人的研发工作
核心提示
今年,ChatGPT上线后的大火出圈,让AIGC(AI Generated Content,即生成式人工智能)引发了各界强烈关注。
今年4月11日,国家网信办发布了《生成式人工智能服务管理办法(征求意见稿)》。在一个新产业发展初期就出台相关管理办法,从另一侧面也佐证了这一产业新业态的“火热”。
如今在福建,也有不少企业正在加速布局这一人工智能“新赛道”,在文档、图片、安全等领域甚至走在全国前列。
闽企应势而动
4月25日,福昕软件海外版云产品Foxit PDF Editor Cloud上线PDF文档总结、内容改写、实时问答等AIGC功能。
据介绍,这些新功能便是通过调用ChatGPT的能力帮助知识工作者理解文档、生成内容。“可以快速、准确地总结出PDF文档的段落或全文信息要点,还提供改写功能,在不改变原有内容意思的前提下,优化文档内容的表达。同时,还可就文档内容实现问答交互。”福昕软件创始人兼董事长熊雨前告诉记者。
福昕软件深耕数字化办公领域二十余年,目前在PDF(版式文档)解决方案市场,份额已是全国最大、全球第二。
四年前,这家企业开始布局人工智能。其中,由人工智能驱动的PDF编辑工具Smart Redact,可通过智能识别语义找到并永久擦掉文档中包含的敏感信息和涉密信息,已广泛应用于法院、律所等对敏感信息处理有频繁且深度需求的机构。
“在人工智能大发展之前,电脑程序处理文档是公认的难题。机器能读懂代码,但无法理解人类所写的文档。”熊雨前表示。
彼时,文档更多被视为工具,而非能力。
随着人工智能,特别是大模型快速发展,机器对文字内容、图形图像、视频的理解逐步提升,加之多年来福昕在文档结构分析、自然语义理解等领域的积累,让智能文档处理在算法方面取得突破。这都让熊雨前坚信智能文档处理的时代将至,“机器至少在部分领域可以替代人或帮助人来进行文档处理”。
同样得益于对人工智能的提前布局,美图公司近期也迎来了在AIGC领域的厚积薄发。
“上传一张照片,就能马上生成二次元风格的照片或者视频,或者简单画几笔就能变出一幅酷炫的大作,挺有趣的。”在厦门大学就读广告学专业的刘思涵很喜欢这些有趣的功能。
5月23日,美图公司旗下美图秀秀正式上线“美图AI”频道,整合此前推出的“AI绘画”“AI设计”“AI视频”等多项功能,为用户提供一站式AIGC创作方式和内容生产工具。
据美图公司技术副总裁刘洛麒介绍,早在2010年,公司就成立MT Lab(美图影像研究院),聚焦计算机视觉、机器学习、深度学习等人工智能领域的前沿技术研发。2013年,MT Lab开始布局深度学习,随后几年陆续推出了“手绘自拍”“绘画机器人”等AIGC雏形产品。
“我们始终致力于构建顶尖技术研发团队,在北京、深圳、厦门等城市均有设立研发团队,并且在算力方面也与头部云服务厂商开展合作。依托在人工智能领域的长线布局与持续探索,为去年以来美图AIGC产品的持续爆发打下坚实基础。”刘洛麒说。
商业空间初显
在厦门人工智能安全研究院院长刘兵看来,AI大模型日渐成熟和规模化应用,让机器快速处理或生成文字、语音、代码、图像等内容成为可能,而凸显的降本增效优势、日益增长的市场需求,也让生成式人工智能迅速成为新一轮“兵家必争之地”。
福州市民张茗在淘宝上经营服饰类买手店,以往招募模特拍广告是网店一笔不菲的开销。“服装上身图拍摄的模特费用可达上千元,还需要场地、化妆、后期制作等上万元的拍摄费用。”
如今,借助“AI换装”,张茗的网店经营成本大幅下降。
“只要上传需要展示的服饰图片,系统就会自动进行图像分析,再选择一个合适的虚拟模特,1分钟就能生成一张真假难辨的效果图了。”张茗说。
“AI换装”是美图5月9日面向B端上线的新功能,其基于AIGC的衣服和模特渲染系统为业界首创。
“这一功能基于超大规模的衣服数据库训练的2D图像分析与匹配系统,可快速准确地识别衣服类型以及定位关键特征。同时,通过人体重建系统,精准地重建人体模型与衣服,并抽取细粒度3D特征。最终实现将平铺衣服渲染到虚拟模特身上,达到贴合自然的效果。”刘洛麒说。
与之类似,美图上线的“AI商品图”“AI海报”功能也均瞄准B端市场场景,为电商从业者、微信营销用户等人群降本增效助力。
“影像和AIGC的创新结合,将带来影像生产力的大爆发,同时会为相关领域带来新职业和新创业机会。”美图公司创始人兼首席执行官吴欣鸿表示。
近日,厦门火炬高新区“企业服务中心”平台上线了AI数字人“小炬”。想要了解火炬高新区的惠企政策,“小炬”便会通过生动的方式,以视频、语音、文字全媒体方式呈现政策解读。
打造“小炬”的企业叫黑镜科技,是一家多模态的AIGC公司,以生成式AI数字人为技术核心。“相较采用纯CG级别或手工制作方式去打造成本高昂的数字人,我们是通过算法和生成式的技术,基于上传一张照片或者输入一段文本,可马上生成AI数字人。”黑镜科技合伙人兼首席品牌官贺丹说。
黑镜科技的核心研发团队在人工智能和计算机图形学领域深耕十多年,此前该公司的一款现象级APP小偶,让人脸重建算法得到全球上亿次用户的检验。
基于此,黑镜科技围绕企业经营流程打造了开箱即用的AI数字人,并已解决了生成式AI落地应用中安全性、准确性和业务逻辑专业性等问题,让企业能够低成本、高效率地创建7×24小时不间断在岗、安全专业的“数字员工”。“同时,我们MetaMaker Studio平台拥有海量3D素材资产,只需要一个数字编导,就能在这个平台完成数字人、数字内容、数字场域相结合的虚拟内容的产出。”贺丹说。
福昕如今也把目标瞄准细分领域,赋能线下行业。
“我们正在和一些行业的合作伙伴合作,来做针对某些行业和领域的智能文档解决方案。比如在家装图纸管理系统,已经在用AI来做一些智能辅助设计。”熊雨前认为,通用人工智能、特定的领域知识辅以文档结构分析,成为智能文档处理赋能行业的关键。
机遇与挑战并存
随着生成式人工智能内容大量涌现,相关应用在提升人们生产效率的同时,也有人对其形成盲目依赖,甚至也有不法分子利用其生成虚假内容、虚假形象行扰乱社会运行正常秩序之“实”。采访中,各界纷纷呼吁,要谨慎对待AIGC。
“数字峰会期间,我就曾提醒大家,不能将以ChatGPT为代表的工具当作‘万事通’。归根结底,它是一种算法而非知识,且是没有记忆的。”熊雨前说。
在他看来,作为生成式AI模型,其专长是“生成”,“其实也可以理解成是一种看似合理的‘瞎编’,问得越细,出错的概率越大。”因此人类可以将其视为辅助工具,但不能把它当成知识体系。“我们在做智能文档处理的时候,会用到像GPT这样的大模型,但会把它的使用控制在一定的范围内,避免其过度‘生成’。”熊雨前说。
美亚柏科AI安全首席科学家金辉认为,生成式人工智能的内容确实让人很难辨别真假,让人颠覆了眼见为实的认知,犯罪分子也会利用生成式人工智能进行新型网络犯罪手段的诈骗,这都对人工智能安全带来一定的挑战。
鉴于此,美亚柏科对AIGC的布局恰恰是“反生成式AI”,即依靠AIGC的逆向工程原理开发人工智能产品。“相当于对生成式AI输出的结果进行逆向解码,给出鉴别判断,或恢复到之前的原形状态。”金辉说。
近期,美亚柏科发布了AI-3300“慧眼”视频图像鉴真工作站,可对深度合成伪造的视频图像、AIGC生成视频图像进行监测鉴定;该公司推出的AIGC检测平台也支持AIGC生成文本的检测识别。
尽管如此,业界还是对生成式人工智能发展保持期待。他们认为,“泡沫”终将被挤出,当潮水退去的时候,就是真正“硬核”的技术涌现的时候。
“生成式人工智能固然并不会完全取代我们的工作,但作为一项新技术必须去积极拥抱,尤其是要善用通用人工智能大模型这类‘基础设施’,借助其来构建更多产品,推动AI技术向前向好发展。”贺丹认为,随着AI技术的不断发展,AIGC的应用将更加多元化,企业将持续革新产品,与千行百业深度融合。
刘兵认为,生成式人工智能技术发展考验的是数字科技企业集成、融合、调用这些新兴技术的综合能力。一方面,其客观上将推动数据分析、视觉芯片、数字版权、超级计算等相关领域的不断进步,倒逼政府、社会提供高质量的数据供给;另一方面,也考验各家企业运用新技术,不断创造符合实体经济、生产生活需要的应用场景,加快虚实融合的创新探索的能力。