摆脱模仿 硬核创新

美术报

15小时前

我们未来能否继续在AGI或美术设计与评论的发展中,稳居国内外高地的重要一席,完全取决于自觉突破专业硬核的创新与更开放(例如用开源替代闭源)、更高效(例如用多个小道通行来避免万众挤过独木桥)、更普惠(例如制作人人用得起的工具)等完善行业生态构建的能力。

春节前后,一家由多位人工智能领域的资深科学家和工程师创立的杭州深度求索人工智能基础技术研究有限公司,专注于实现AGI(通用人工智能)的中国科技公司及其有原创核心技术、旨在通过创新推动人工智能在多个领域落地的LLM(大语言模型英文名称的首写字母)的研发与应用成果——DeepSeek(深度求索)在美术设计与美术史论界引起了热烈的研讨与持续的应用。

通过我与美术设计界和美术史论界友人们的学术互动,关于DeepSeek在各自专业领域如何应用的问题,我们认为需要把握以下几个关键的知识点:

1、DeepSeek的核心技术与产品支持中英文双语,在数学、代码等复杂推理任务中表现比较突出,目前它所具有的多模态能力只有部分模型可以整合图像、语音等不同模态输入。对中文古籍插图、书法等视觉艺术元素的识别能力还有待提升。当前版本主要还是针对静态图像处理,视频理解尚未完全开放。

2、DeepSeek的MoE(混合专家模型)架构,兼顾了人工智能的性能与训练成本效率。其高效训练技术是通过算法优化降低训练成本(其官宣是该产品在同等效果下成本为行业1/100)。如果我们用美术设计方面的形象思维方式来表述的话,就是DeepSeek根据中国的实际情况,成功避开国外竞品用大算力解决大模型的高成本套路,开创性地只用了2048张H100的GPU(一种专门用于图形处理和并行计算的处理器)集群的小算力,进行垂直领域深耕并解决了超大模型算法发展瓶颈的问题,以极小的团队规模支撑起了千亿级的调用量。其对中文语境理解得更精准,较符合中国市场应用方的需求,比国外竞品在国内市场更具有竞争优势。

3、DeepSeek现有版本的技术亮点在于:目前能较好地理解上下文,支持128k的tokens(人工智能自然语言处理领域中的一个重要概念,指的是将文本拆分成一个个小单元,这些单元可以是单个的字词、字符,或者是具有特定意义的子词。)以上的长文本处理,适合复杂文档分析和辅助撰写美术评论文章。

我和景观设计等方面的友人最近用诗词创作、千字短文、检索调研资料、规划设计、生成提示词来制作文生图的贺年卡与文生视频等任务的免费实测,使用了DeepSeek的部分功能,85%尚能满足用户提示语的要求,15%还是需要作者手动调整。

4、目前,DeepSeek除了开放了多个模型的权重和训练数据(如DeepSeek-67B-base),供研究者和开发者免费使用外,还提供了API(Application Programming Interface,是一组定义、程序及协议的集合)接口和微调工具链,能作为教育和科研方面的个性化学习助手。

5、对现阶段 DeepSeek产品的争议点在于其开源模型的合规性使用与防止恶意利用的数据安全;由于用户“投喂”的专业数据量还不够大和各利益集团数字壁垒多,如何对长上下文场景下的幻觉(Hallucination)进行控制,并减少在简单任务中“碰壁”,以及AGI路径的可行性等。

我个人认为,对任何新事物,各方面都会有不同看法,有些争议是正常的,但不能对其一味神化或妖魔化。

6、DeepSeek-v2版本的近期动态是使推理能力更接近国际一流竞品的最新版本,要与多家高校合作推进人工智能领域的对齐(Alignment)研究等。

7、DeepSeek代表了国产人工智能大模型快速迭代的典型路径——通过开源积累生态、以垂域应用实现商业化,技术上有明确的普惠和效率导向。其发展也反映了中国人工智能行业在算力限制下寻求突破的努力等多维度的高水平,关键是研发团队在国内外数字化、智能化AGI产品层出不穷的历史背景下,能积极主动地以中国智慧另辟蹊径、摆脱模仿、求索自主话语体系的担当意识,很值得美术设计界以及美术史论界的人士学习。

综上所述,我们未来能否继续在AGI或美术设计与评论的发展中,稳居国内外高地的重要一席,完全取决于自觉突破专业硬核的创新与更开放(例如用开源替代闭源)、更高效(例如用多个小道通行来避免万众挤过独木桥)、更普惠(例如制作人人用得起的工具)等完善行业生态构建的能力。

我相信美术设计界和美术史论界关注国内外新质生产力竞争新赛道的人士,会不断地顺势而为,在熟悉数智化新工具和提高创作新作品效率的过程中,主动重置自己。

(作者系中国美术学院教授)

我们未来能否继续在AGI或美术设计与评论的发展中,稳居国内外高地的重要一席,完全取决于自觉突破专业硬核的创新与更开放(例如用开源替代闭源)、更高效(例如用多个小道通行来避免万众挤过独木桥)、更普惠(例如制作人人用得起的工具)等完善行业生态构建的能力。

春节前后,一家由多位人工智能领域的资深科学家和工程师创立的杭州深度求索人工智能基础技术研究有限公司,专注于实现AGI(通用人工智能)的中国科技公司及其有原创核心技术、旨在通过创新推动人工智能在多个领域落地的LLM(大语言模型英文名称的首写字母)的研发与应用成果——DeepSeek(深度求索)在美术设计与美术史论界引起了热烈的研讨与持续的应用。

通过我与美术设计界和美术史论界友人们的学术互动,关于DeepSeek在各自专业领域如何应用的问题,我们认为需要把握以下几个关键的知识点:

1、DeepSeek的核心技术与产品支持中英文双语,在数学、代码等复杂推理任务中表现比较突出,目前它所具有的多模态能力只有部分模型可以整合图像、语音等不同模态输入。对中文古籍插图、书法等视觉艺术元素的识别能力还有待提升。当前版本主要还是针对静态图像处理,视频理解尚未完全开放。

2、DeepSeek的MoE(混合专家模型)架构,兼顾了人工智能的性能与训练成本效率。其高效训练技术是通过算法优化降低训练成本(其官宣是该产品在同等效果下成本为行业1/100)。如果我们用美术设计方面的形象思维方式来表述的话,就是DeepSeek根据中国的实际情况,成功避开国外竞品用大算力解决大模型的高成本套路,开创性地只用了2048张H100的GPU(一种专门用于图形处理和并行计算的处理器)集群的小算力,进行垂直领域深耕并解决了超大模型算法发展瓶颈的问题,以极小的团队规模支撑起了千亿级的调用量。其对中文语境理解得更精准,较符合中国市场应用方的需求,比国外竞品在国内市场更具有竞争优势。

3、DeepSeek现有版本的技术亮点在于:目前能较好地理解上下文,支持128k的tokens(人工智能自然语言处理领域中的一个重要概念,指的是将文本拆分成一个个小单元,这些单元可以是单个的字词、字符,或者是具有特定意义的子词。)以上的长文本处理,适合复杂文档分析和辅助撰写美术评论文章。

我和景观设计等方面的友人最近用诗词创作、千字短文、检索调研资料、规划设计、生成提示词来制作文生图的贺年卡与文生视频等任务的免费实测,使用了DeepSeek的部分功能,85%尚能满足用户提示语的要求,15%还是需要作者手动调整。

4、目前,DeepSeek除了开放了多个模型的权重和训练数据(如DeepSeek-67B-base),供研究者和开发者免费使用外,还提供了API(Application Programming Interface,是一组定义、程序及协议的集合)接口和微调工具链,能作为教育和科研方面的个性化学习助手。

5、对现阶段 DeepSeek产品的争议点在于其开源模型的合规性使用与防止恶意利用的数据安全;由于用户“投喂”的专业数据量还不够大和各利益集团数字壁垒多,如何对长上下文场景下的幻觉(Hallucination)进行控制,并减少在简单任务中“碰壁”,以及AGI路径的可行性等。

我个人认为,对任何新事物,各方面都会有不同看法,有些争议是正常的,但不能对其一味神化或妖魔化。

6、DeepSeek-v2版本的近期动态是使推理能力更接近国际一流竞品的最新版本,要与多家高校合作推进人工智能领域的对齐(Alignment)研究等。

7、DeepSeek代表了国产人工智能大模型快速迭代的典型路径——通过开源积累生态、以垂域应用实现商业化,技术上有明确的普惠和效率导向。其发展也反映了中国人工智能行业在算力限制下寻求突破的努力等多维度的高水平,关键是研发团队在国内外数字化、智能化AGI产品层出不穷的历史背景下,能积极主动地以中国智慧另辟蹊径、摆脱模仿、求索自主话语体系的担当意识,很值得美术设计界以及美术史论界的人士学习。

综上所述,我们未来能否继续在AGI或美术设计与评论的发展中,稳居国内外高地的重要一席,完全取决于自觉突破专业硬核的创新与更开放(例如用开源替代闭源)、更高效(例如用多个小道通行来避免万众挤过独木桥)、更普惠(例如制作人人用得起的工具)等完善行业生态构建的能力。

我相信美术设计界和美术史论界关注国内外新质生产力竞争新赛道的人士,会不断地顺势而为,在熟悉数智化新工具和提高创作新作品效率的过程中,主动重置自己。

(作者系中国美术学院教授)

展开
打开“财经头条”阅读更多精彩资讯
APP内打开