作者|Mr.K
来源 | 技术领导力 管理智慧
咨询合作| 13699120588
文章仅代表作者本人观点
每年春节前夕,各家平台纷纷推出花样繁多的营销活动,玩法更是推陈出新,好不热闹。今年却有些不一样,以百度搜索的「AI拜年」为例,融合了AI的能力,用户只要上传照片并输入一句话prompt,就能生成一张年味十足的定制拜年贺卡。
也许你会好奇,AI生成的图片会不会「AI味儿」很重?困扰已久的幻觉问题,怎么办?AIGC的人物会不会有恐怖谷效应?下面,跟随K哥一起来测评吧。
01
当AI有了「文化大脑」
现在,打开百度首页,搜索“祝福语”,进入到拜年的搜索结果页,点击“做贺卡”进入到定制页面,通过“创意照片”上传你想要“玩”的图片。图片生成加上祝福语,你就拥有独一无二的新年祝福卡片。
我惊喜地发现,无论是出图质量还是准确度,都十分优秀,有别于市面上的一些文生图大模型。于是,我继续深入做些测评,K哥先上传一张马斯克的照片,然后输入提示词:图中的人物在东方明珠吃火锅。
还不错吧?再生成一张:在黄浦江的游艇上打掼蛋。哈哈哈哈,果然都是金钱的味道。
大过年的,怎么能没有饺子呢?帮我生成一张:在埃菲尔铁塔包饺子。看这架势,没个三五年手艺包不出这形儿,AI也太懂人间烟火气了。
写实的风格,已经难不倒AI了,接下来试试跨空间的创意。先来一张:沙漠里的天坛。雄伟壮观、古朴典雅,真不愧是中国古代建筑的杰出之作。
再画一张:深山里的“上海三件套”。开始我是忐忑的,直到看到这张图片,被彻底震撼了,连上海三件套都能理解到位、精准出图,请收下我的膝盖。
有山怎么能没有水呢?再来一张:海边的福建土楼。
一番测评下来,我直呼:这个AI太有「文化」、太上头了,根本停不下来。基于百度搜索的亿级图片资源,结合强大的基础模型能力,在春节这样最具中国特色的传统节日中,精准的文化优势得以凸现。
看到这里,你一定跟我一样好奇:为什么AI味儿、幻觉问题、恐怖谷效应都神奇般的消失了?这背后的秘密就是AI生产力神器---百度iRAG。
02
百度iRAG,大揭秘
1)百度iRAG,究竟是啥?
iRAG(image based RAG),就是百度自研的检索增强的文生图技术,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,就可以生成接近真实世界的图片,整体效果远远超过文生图原生系统,去掉了AI味儿,也就解决了恐怖谷效应问题,工程实现的成本还很低。总的来说,iRAG具有无幻觉、超真实、没成本、立等可取等特点。
通过以上测评,想必都对iRAG的能力有了认识,百度基于iRAG技术打造了“AI拜年”产品,让AI真正服务于春节这样的传统节日,普通用户都可以用来生成想象力丰富的图片,让年更「好玩」,充分感受到AI技术的魅力。
2)iRAG解决了什么问题?
首先是幻觉问题,这也是大模型规模化落地应用的主要限制之一。大模型幻觉是指大模型在生成文本、图像、视频等内容时,模型可能会产生不符合事实或不准确的信息,也就是大家常说的:一本正经的“胡说八道”。就目前来说,解决大模型幻觉的一种有效办法是RAG(检索增强生成)。
但是在文生图片、文生视频等多模态领域RAG的结合还不够,幻觉问题非常普遍,比如某开源模型生成的北京天坛的照片有4层,而真正的天坛是3层,再比如会出现一个人类的手掌有6个手指等等。直到2024年百度推出了iRAG技术,解决了多模态的幻觉问题。
其次,iRAG实现了准确性上的突破,准确性是评估AI生成图像效果的首要标准,生成的图像必须真实反映现实世界。举例来说,你想生成贝克汉姆的图片,AI却给你生成了梅西,这样的大模型肯定是没戏的。百度搜索收录了海量特定事物的可信图片资源,大模型与这个靠谱的“外挂知识库”相结合,iRAG生成的图像,准确率更高、幻觉更少。
03
AI科技的车轮,滚滚向前
跟任何一次科技浪潮一样,AI技术发展势不可挡,并且越来越深刻地改变人们的生活和生产方式。以百度iRAG为例,iRAG在影视作品、漫画作品、连续画本、海报制作等领域都有广泛的应用空间,不仅可以有效降低AI生图的幻觉问题,而且生成的图片更真实、自然,更重要的是大幅降低了创作成本。iRAG技术,好比一个「产业加速器」,许多产业将发生变革。
举例来说,在品牌宣传领域,用传统的方式拍一组汽车大片,找场景、拍摄、后期修图等等,没有几十万根本搞不定。现在有了iRAG,一个人、一台电脑就能轻松出图,创作成本接近于0。
这场AI技术浪潮是不可逆的,K哥非常看好iRAG在各行业的应用前景,我身边的设计师朋友,80%都已经在用AI提升工作效率。我们已经进入到一个“人人都是设计师”的时代,相信不久的将来,就连卖煎饼果子的老板都能用AI设计出自己的专属菜单,iRAG将普惠每一位创作者。
04
正如百度创始人李彦宏所说的:“过去这24个月,对这个行业而言,最大的变化是什么?我的回答一定是,大模型基本消除了幻觉,回答问题的准确性大幅提升了,这让AI从‘一本正经的胡说八道’,变得可用、可被信赖。” 在K哥看来百度iRAG技术,无疑是2024年AI行业的一大亮点,也是最重要的AI技术创新之一。
有理由相信,iRAG与千行百业的场景融合,必定会迸发出更多创意和创新的火花,希望有更多人拿起AI工具,加入到创作者的行列,最后以一句史蒂夫·乔布斯的名言作为结尾,与你共勉:“创新,是领导者与跟随者的区别所在。”
END
华夏基石AI战略领导力特训营2025年第四期开始报名!
抓住数字智能时代的机遇,团报即可享受优惠!
机会难得,名额有限,别错过!
报名及咨询:柳老师15202171854
喜欢这篇文章
请为我点赞和在看
作者|Mr.K
来源 | 技术领导力 管理智慧
咨询合作| 13699120588
文章仅代表作者本人观点
每年春节前夕,各家平台纷纷推出花样繁多的营销活动,玩法更是推陈出新,好不热闹。今年却有些不一样,以百度搜索的「AI拜年」为例,融合了AI的能力,用户只要上传照片并输入一句话prompt,就能生成一张年味十足的定制拜年贺卡。
也许你会好奇,AI生成的图片会不会「AI味儿」很重?困扰已久的幻觉问题,怎么办?AIGC的人物会不会有恐怖谷效应?下面,跟随K哥一起来测评吧。
01
当AI有了「文化大脑」
现在,打开百度首页,搜索“祝福语”,进入到拜年的搜索结果页,点击“做贺卡”进入到定制页面,通过“创意照片”上传你想要“玩”的图片。图片生成加上祝福语,你就拥有独一无二的新年祝福卡片。
我惊喜地发现,无论是出图质量还是准确度,都十分优秀,有别于市面上的一些文生图大模型。于是,我继续深入做些测评,K哥先上传一张马斯克的照片,然后输入提示词:图中的人物在东方明珠吃火锅。
还不错吧?再生成一张:在黄浦江的游艇上打掼蛋。哈哈哈哈,果然都是金钱的味道。
大过年的,怎么能没有饺子呢?帮我生成一张:在埃菲尔铁塔包饺子。看这架势,没个三五年手艺包不出这形儿,AI也太懂人间烟火气了。
写实的风格,已经难不倒AI了,接下来试试跨空间的创意。先来一张:沙漠里的天坛。雄伟壮观、古朴典雅,真不愧是中国古代建筑的杰出之作。
再画一张:深山里的“上海三件套”。开始我是忐忑的,直到看到这张图片,被彻底震撼了,连上海三件套都能理解到位、精准出图,请收下我的膝盖。
有山怎么能没有水呢?再来一张:海边的福建土楼。
一番测评下来,我直呼:这个AI太有「文化」、太上头了,根本停不下来。基于百度搜索的亿级图片资源,结合强大的基础模型能力,在春节这样最具中国特色的传统节日中,精准的文化优势得以凸现。
看到这里,你一定跟我一样好奇:为什么AI味儿、幻觉问题、恐怖谷效应都神奇般的消失了?这背后的秘密就是AI生产力神器---百度iRAG。
02
百度iRAG,大揭秘
1)百度iRAG,究竟是啥?
iRAG(image based RAG),就是百度自研的检索增强的文生图技术,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,就可以生成接近真实世界的图片,整体效果远远超过文生图原生系统,去掉了AI味儿,也就解决了恐怖谷效应问题,工程实现的成本还很低。总的来说,iRAG具有无幻觉、超真实、没成本、立等可取等特点。
通过以上测评,想必都对iRAG的能力有了认识,百度基于iRAG技术打造了“AI拜年”产品,让AI真正服务于春节这样的传统节日,普通用户都可以用来生成想象力丰富的图片,让年更「好玩」,充分感受到AI技术的魅力。
2)iRAG解决了什么问题?
首先是幻觉问题,这也是大模型规模化落地应用的主要限制之一。大模型幻觉是指大模型在生成文本、图像、视频等内容时,模型可能会产生不符合事实或不准确的信息,也就是大家常说的:一本正经的“胡说八道”。就目前来说,解决大模型幻觉的一种有效办法是RAG(检索增强生成)。
但是在文生图片、文生视频等多模态领域RAG的结合还不够,幻觉问题非常普遍,比如某开源模型生成的北京天坛的照片有4层,而真正的天坛是3层,再比如会出现一个人类的手掌有6个手指等等。直到2024年百度推出了iRAG技术,解决了多模态的幻觉问题。
其次,iRAG实现了准确性上的突破,准确性是评估AI生成图像效果的首要标准,生成的图像必须真实反映现实世界。举例来说,你想生成贝克汉姆的图片,AI却给你生成了梅西,这样的大模型肯定是没戏的。百度搜索收录了海量特定事物的可信图片资源,大模型与这个靠谱的“外挂知识库”相结合,iRAG生成的图像,准确率更高、幻觉更少。
03
AI科技的车轮,滚滚向前
跟任何一次科技浪潮一样,AI技术发展势不可挡,并且越来越深刻地改变人们的生活和生产方式。以百度iRAG为例,iRAG在影视作品、漫画作品、连续画本、海报制作等领域都有广泛的应用空间,不仅可以有效降低AI生图的幻觉问题,而且生成的图片更真实、自然,更重要的是大幅降低了创作成本。iRAG技术,好比一个「产业加速器」,许多产业将发生变革。
举例来说,在品牌宣传领域,用传统的方式拍一组汽车大片,找场景、拍摄、后期修图等等,没有几十万根本搞不定。现在有了iRAG,一个人、一台电脑就能轻松出图,创作成本接近于0。
这场AI技术浪潮是不可逆的,K哥非常看好iRAG在各行业的应用前景,我身边的设计师朋友,80%都已经在用AI提升工作效率。我们已经进入到一个“人人都是设计师”的时代,相信不久的将来,就连卖煎饼果子的老板都能用AI设计出自己的专属菜单,iRAG将普惠每一位创作者。
04
正如百度创始人李彦宏所说的:“过去这24个月,对这个行业而言,最大的变化是什么?我的回答一定是,大模型基本消除了幻觉,回答问题的准确性大幅提升了,这让AI从‘一本正经的胡说八道’,变得可用、可被信赖。” 在K哥看来百度iRAG技术,无疑是2024年AI行业的一大亮点,也是最重要的AI技术创新之一。
有理由相信,iRAG与千行百业的场景融合,必定会迸发出更多创意和创新的火花,希望有更多人拿起AI工具,加入到创作者的行列,最后以一句史蒂夫·乔布斯的名言作为结尾,与你共勉:“创新,是领导者与跟随者的区别所在。”
END
华夏基石AI战略领导力特训营2025年第四期开始报名!
抓住数字智能时代的机遇,团报即可享受优惠!
机会难得,名额有限,别错过!
报名及咨询:柳老师15202171854
喜欢这篇文章
请为我点赞和在看