梅涛的“DeepSeek时刻”
发布时间:2025-07-17 19:39 浏览量:1
智象未来
3个月前,智象未来宣布,其自主研发的图像生成大模型HiDream-I1全面开源。这一被称为开源版“GPT-4o”的图像生成大模型,迅速登顶Artificial Analysis榜单,成为首个登顶该榜单的中国自研生成式AI模型。
这场被业界称为“图片生成领域的DeepSeek时刻”,背后藏着一个鲜为人知的故事——由15位中科大校友,组成的合伙人LLP,用一笔代号“‘中喝大’种子一号”的早期投资,为这场突围埋下了第一粒火种。这15位投资人都来自一个名为“中喝大”的中科大校友群。
过去的一年,在OpenAI发布的Sora爆火后,包括腾讯混元、快手可灵等视频大模型开始出圈,行业竞争愈发激烈。
7月2日,元新闻记者跟随“活力中国调研行”安徽主题采访团,走进位于合肥高新区的智象未来(合肥)信息技术有限公司(以下简称“智象未来”)。智象未来创始人兼CEO梅涛告诉元新闻记者,目前视频生成还处于GPT-2到GPT-3之间的阶段。“(目前)大模型商业化仍不明显,离最后的商业应用还是差‘最后一公里’”。
01/“图片生成领域的DeepSeek”
以AI为核心的新一轮科技革命浪潮正重塑世界格局,孕育着驱动未来经济增长的巨大潜能。2022年以来,以大模型为代表的生成式AI技术取得惊人突破,让通用人工智能(AGI)的曙光仿佛触手可及。
目前,业界认为,通向通用人工智能(AGI)有三条路径:
第一条路径是大语言模型。即以文字为单位,将人类历史上所有文字的信息压缩在一个大模型中,进行简单的逻辑推理;
第二条路径是具身智能。即通过训练,让机器人模拟人类动作,进而完成一些特定的工艺;
另外一条路径是多模态大模型。即以像素为单位,通过视觉的信号、像素模拟物理世界的角度。多模态大模型能够同时生成和理解文本、音频、视频等多种信息类型,使机器具备更接近人类的感知与推理能力。这就是梅涛选择的赛道,探索视频生成的商业化未来。
AI、AIGC和AGI的区别:
AI是一个广泛而深入的概念,涵盖了人工智能的各个方面;
AIGC是AI在内容创作领域的一种应用,提高了内容生产的效率和质量。专注于自动生成内容,如文本、图像、音频和视频等;
AGI则是AI发展的一个更高阶段,追求的是全面的认知能力,技术特点则在于其能够跨领域地进行思考和学习,同时具备自主意识和情感。
三者相互联系又相互区别,共同推动着人工智能领域的发展和进步。
梅涛是中国科学家创业的典型代表。
梅涛在2025年中科大信息学院典礼上发言
梅涛毕业于中国科学技术大学,曾在微软亚洲研究院工作12年,是IEEE Fellow和加拿大工程院外籍院士,于2023年创办智象未来。
2017年,梅涛与中国科学技术大学信息学院教授李厚强及潘滢炜、邱钊凡两位博士生合作,发表了业界最早探索文生视频的论文。这段经历被梅涛视为智象未来选择多模态大模型的“种子”。
探索文生视频论文
在多模态大模型领域,智象未来选择了相对细分的短视频广告和视频的生产力工具。梅涛对于商业前景的判断是,AI对于前述领域的影响力更高,视频在全球市场有着万亿美金,而AI渗透率尚不足5%。
公开资料显示,2024年全球人工智能生成内容(AIGC)约200亿美金的收入中,50%-60%来自视频和图像。2023年,Midjourney在这方面的收入已达2亿美金,已经验证了PMF(Product Market Fit,产品市场契合度)。
“视频行业这个赛道不需要太大投入,规模可控,而且离商业化进展最近。” 梅涛强调,与大语言模型领域动辄需要千卡级(2023年)甚至万卡级(2024年)算力的重资产投入不同,视频内容创作的技术门槛和资金压力相对较低。
梅涛告诉元新闻记者,在当时的创业环境下,初创企业若选择与大厂在基础大模型领域直接竞争,不仅面临巨额融资压力,还要应对头部企业已建立的规模优势,生存空间极为有限。相比之下,视频行业更注重创意和垂直场景的深耕,为创业者提供了差异化的突围机会。
今年4月,智象未来自主研发的开源图像生成大模型HiDream-I1在国际权威榜单Artificial Analysis中24小时内实现登顶,成为首个跻身全球第一梯队的中国自研生成式AI模型,并在图像质量、语义理解、艺术表现三大维度刷新行业纪录。
智象未来工作人员告诉记者,HiDream-I1是一个拥有17B参数的新型开源图像生成模型,可在几秒钟内实现最先进的图像生成,涵盖动漫、人物肖像、科幻等多种风格。
有业内人士认为,从整体上看,HiDream-I1生成的图在真实感、细腻度上和GPT-4o非常接近,有时还能更胜一筹。与Flux相比时,这个特点更加明显。
“请帮我生成一段大熊猫在竹林里表演武术的视频。”只需要输入一句话,等待片刻,一段高清视频便迅速呈现。7月2日,元新闻记者在智象未来展厅里看到,一场“文字转视频”正在上演。输入“刀切水晶苹果”“刀切熔浆”等指令,数秒后,这些现实难以模拟的画面便跃然屏上:水晶苹果在刀刃下如坚冰裂开,流动的熔浆也轻易被分开两边。
展厅一侧,一台通体粉色的设备,引起了在场参观者的注意。工作人员告诉元新闻记者,这台设备能够实现AI一键换装:上传一张产品图,即可自动生成广告短视频;输入一句描述,即可生成创意图片和短视频;选好一款虚拟职业装,再自拍一下,即可生成卡通形象照……
AI卡通换装
2025年,对AI来说至关重要。
有分析认为,2025年世界将迎来通用人工智能(AGI),AI可能会挑战人类社会;也有观点认为,现今的AI连图灵测试(探究机器能否模拟出与人类相似或无法区分的智能 编者注)都未通过,言其将挑战人类社会还为时过早。
但不可否认的是,过去的一年,全球经历了一场有关人工智能的巨变。
2024年人工智能技术发展的五个标志性事件:
1.OpenAI发布视频AI模型Sora;
2.OpenAI推出多模态大模型ChatGPT-4o;
3.GPT-o1的更新;
4.具身智能;
5.AI促进科学发展:诺贝尔物理学奖首次颁发给AI领域的科学家。
“今年对我们来说很重要,我们要留在牌桌上。”梅涛认为,2024年初,Sora 的亮相,将文生视频技术推向 AI 领域竞争的新高地,但该产品基于的扩散模型(DiT) 仍有很多问题待解决。在多模态大模型领域,还没有一家厂商的模型有绝对的优越性,属于多模态的“Chat GPT”时刻还未到来,大家仍有机会。
梅涛认为,近些年大语言模型基本都是在GPT的框架内,框架一旦固化,无论是美国还是中国,大语言模型都开始迅速收敛,该领域的竞争逐渐成为头部厂商拼规模的游戏。但在多模态领域还没有出现类似GPT—3的成熟模型,要解决视频创作的问题,有三个关键点要达到,即叙事性、稳定性和可控性,这是突破商业化瓶颈的关键所在。
元新闻记者注意到,2024年,越来越多的企业和资本涌入AI赛道,尤其是在视觉多模态领域,竞争愈发激烈。新的创业公司不断诞生,传统科技巨头也在加大投入。
智象未来算法科学家潘滢炜在今年6月的一次采访中曾表示,当前视觉多模态AI 领域的竞争格局呈现出复杂且激烈的态势。
一方面,科技巨头凭借雄厚的资金实力、海量的数据资源、强大的研发团队和广泛的市场渠道,在竞争中占据优势地位。另一方面,新兴的创业公司则以创新的技术和灵活的市场策略为突破口。像智象未来这样专注于特定细分领域,通过技术创新打造差异化竞争优势,快速响应市场需求推出创新性产品。
此外,梅涛在回答元新闻记者提问时指出,原则上,智象未来不会触碰特别底层的通用模型,作为创业公司,智象未来不会选择与大厂面对面的竞争,但要在比如电商、营销场景中做到全球领先。
智象未来
“我们不是像OpenAI这样的大厂,拥有那么多的资源,但是我们会在与应用场景结合更紧密的垂类模型上深入地挖掘。” 梅涛说,这与DeepSeek的发展逻辑相对一致,用较低的成本和更高的效率接近大厂的性能。“我们去年的成本是其他家公司的5分之一,但我们迭代速度是别人的5倍,力争留在第一梯队里。”
梅涛坦言,现在智象未来是创业的第三年,商业模式经历了三阶段的变化。
MaaS阶段:2023年,提供模型能力。主要卖模型和API,类似于云计算的PaaS模式。
SaaS阶段:2024年,转向工具化。让用户在智象未来的平台上使用工具生产内容。
RaaS阶段:2025年。交付结果,与客户分佣,用极低成本创造极高价值。
03/安徽人工智能产业居全国第五位
现在,资本市场正敏锐捕捉到潜在的商机。数据显示,截至去年年底,全球围绕大模型产业链关键环节展开的超亿元融资达到168起,融资总额超4000亿元。
智象未来便是典型案例,这家成立仅两年的企业,凭借自主研发的智象大模型,继完成敦鸿资本领投的Pre-A轮融资后又新获以合肥产投为主的国资基金领投的A轮融资,融资规模共计数亿人民币。同时参与投资的还包括安徽省人工智能母基金和湖北省长江电影集团有限公司等机构,此前曾获阿尔法公社与讯飞两轮领投。
“安徽省也非常重视我们,安徽拥有像中科大这样的高校,能够提供大量的AI人才,这对于我们而言,是一个理想的研发大本营。”梅涛说道。
航拍中科大东校区(来源:安徽日报)
据了解,合肥是中国唯一的国家新一代人工智能产业重点布局城市、中国首批数据标注试点基地建设“双重战略叠加”的城市,合肥已集聚超千家AI上下游企业。赛迪顾问最新发布的《中国人工智能区域竞争力研究》显示,2024年安徽人工智能产业发展评价紧随北京、广东、上海、浙江之后,居全国第5位。
据安徽省科技厅副厅长陈龙胜介绍,安徽争取获批国家新一代人工智能创新发展试验区、新一代人工智能公共算力开放创新平台等一批国字号创新平台,承担国家数据要素综合试验区建设等重要任务,合肥获批全国首批、长三角唯一数据标注基地建设试点城市。
同时,安徽在全国率先出台通用人工智能发展三年行动计划和专项政策,系统谋划大算力、大模型、大应用。陈龙胜表示,安徽致力推动大模型软硬件自主可控。支持科大讯飞联合华为开展国产软硬件底座研发,围绕夯实感知、算力、数据、模型等基础和垂类模型应用,在2024年安徽省科技攻关项目中部署人工智能攻关项目59个,引导企业研发投入11.5亿元。(安徽商报 元新闻记者:常诚 梁巍 编辑:龚凤琴)