解锁大模型时代的无限可能,从GPT-3到Sora

ongpt8个月前GPT资讯196

从2020年OpenAI的GPT-3到2023年的GPT-4再到2024年的文生视频模型Sora,我们见证了大模型领域创新速度之快。从百度、阿里和360等为代表的头部科技企业率先入局到互联网公司、AI企业、初创企业、研究机构和科研院校的竞相布局,我们目睹了大模型领域发展势头之盛。过去的一年,大模型产业的战略地位持续提升,资本市场关注度不断增强。放眼海外,大模型竞争格局初现;聚焦国内,“百模大战“鏖战正酣;展望未来,多模态大模型将发挥较大潜力。


01 大模型政策密集发布


2023 – 2024年围绕顶层设计、场景落地和区域发展维度的大模型相关政策密集出台,各类政策的密集发布为大模型产业的快速发展和商业化落地创造了良好政策环境,同时也表明大模型产业在我国战略地位的持续提升,将成为未来一段时间内的重点发展方向。





02 资本市场关注度持续上升


2023年人工智能领域的资本热度相对下滑,但AIGC/大模型在资本市场的关注度持续提高,并出现了智谱AI、百川智能等融资金融超过20亿人民币的事件。


2023年AI领域融资事件总数为585件,技术算法层融资事件182件,占AI领域的31%。在技术算法层细分领域的融资中,AIGC/大模型累计融资156.13亿元,获投公司数90家,融资事件数111件,在包括基础设施和行业应用的所有AI细分领域中,三项指标均领先与行业平均水平。




03 国内“百模大战” 步入深水区


放眼海外大模型竞争格局,目前已形成较为清晰的OpenAI和微软领先,谷歌追赶,Meta发力开源的格局,通用大模型能力相对成熟,应用生态呈现繁荣发展态势。2024年2月16日OpenAI发布的文生视频模型Sora再次引发业内广泛关注,推动AI多模态领域飞跃式发展,AI创作等相关领域将迎来深度变革,持续巩固公司在大模型产业中的领先地位。


聚焦国内大模型的发展历程,2023年2月开始以百度、阿里和360等为代表的头部科技企业陆续推出各自的大模型,2023年6月开始,国内涌现出众多的通用大模型和垂类大模型,目前国内公布的大模型数量已超过200个,市场竞争激烈,大模型行业呈现出“百模大战”的竞争格局。国内大模型产业玩家类型多样,包括头部科技企业(阿里巴巴、百度、腾讯、华为、字节等)、传统AI企业(科大讯飞、商汤科技)、创业公司(百川智能、智谱AI)和研究机构(中科院、复旦大学、上海人工智能实验室)等,头部企业和传统AI企业具备技术、资金和人才优势,创业公司能够迅速响应市场变化提供定制化的解决方案,研究机构在理论研究和技术创新方面优势明显。



04 多模态大模型潜力较大


OpenAI最新发布的文生视频模型Sora推开了新世界的大门,文生视频技术加速演进。作为划时代的文生视频大模型,Sora具有四大核心能力。第一,视频生成能力,Sora能够根据用户提供的文本描述生成长达60S的视频。第二,语言理解能力,利用GPT技术将简短的用户提示转换为更长的详细转译,并将其发送到视频模型。第三,图片生成能力,Sora可以根据用户需求,生成可变大小的图像,最高可达2048 × 2048分辨率。第四,多镜头生成能力,Sora具有3D一致性、较长视频的连贯性和对象持续性,可以在单个生成的视频中创建多个镜头,同时保持角色和视觉风格的一致性,有效地模拟物理和数字世界。


Sora的横空出世进一步增强了业界对于多模态大模型下游应用的关注和期待,未来多模态大模型在视频制作、自动驾驶、营销推广、教育和医疗等领域都将发挥巨大作用。在视频制作领域多模态大模型可以根据剧本或概念生成初步的视觉素材和视频内容,有效提升创造者效率。在自动驾驶领域中,多模态大模型可以整合来自摄像头、雷达、激光雷达等多种传感器的数据,提供更准确的环境理解和决策支持。在营销推广领域中,多模态大模型可以根据市场趋势和消费者偏好,生成吸引人的广告内容,包括视频、图像和文案,有效提高销售转化率。在教育领域中,可以实现教学资源自动生成、人机协同过程支持和教师教学辅助,有效提升教学效率。在医疗领域中,可以整合医学影像、临床记录和患者数据,辅助医生进行更准确的诊断。


随着大模型产业的快速发展,如何降低大模型训练和部署的成本;如何应对大模型带来的安全性挑战;在算力资源有限的情况下市场竞争格局将会如何变化;如何协调“大模型”与“小模型“的关系重塑生产力工具;如何最大化发挥大模型产业赋能效应推动新质生产力发展;伴随着大模型的快速发展,这些话题都是我们需要持续研究和探索的课题。


05 关于 2024 GDC 全球开发者先锋大会


全球开发者们,注意了!!!一年一度的全球开发者先锋大会(GDC)即将在上海掀起科技风暴!!!这不仅仅是一场大会,而是所有代码高手、科技狂热者们的盛大节日!!!GDC 缘起总理在达沃斯世界经济论坛打call的WAIC世界人工智能大会,作为WAIC聚焦科技和人才力量的重要板块,进化到如今的全球开发者嘉年华,已化身顶尖技术风向标,汇集全球顶尖开发者、科技先锋、企业家和学术翘楚,开启一场科技交流狂欢盛典。


2024 GDC 将在上海徐汇滨江召开,这里是科技与文化交汇的前沿阵地,为大会带来无限活力与创新灵感。大会部分同期活动也会在临港等地举行。临港是2023 GAIDC的举办地,有多项重要成果发布,引起各方关注和赞誉。今年我们将开发者的范畴从AI扩展到整个技术领域,从GAIDC到GDC,更是思维的飞跃,让“多元共生”不再是想象。


2024 GDC 主题是“开发者的‘模’力之都”。今年大会全面升级,1场开幕式、5场前沿技术讲坛、10+场平行技术讲坛,及X场工作坊、10000 m2互动体验、竞技场、创客集市、场外活动等,聚焦大模型、人形机器人、开源开放、AIGC等前沿话题,一网打尽科技界的最新动态。


快来2024 GDC,与全球开发者同台竞技,共同探索科技的边界。这是一场科技界的饕餮盛宴,错过再等一年!


相关文章

AI视频生成迎来“GPT时刻”,Sora火爆全球

继Runway、Pika、字节PixelDance、万兴“天幕”发布,2月16日凌晨,“王炸”模型Sora横空出世,AI视频生成迎来“GPT时刻”。在Open AI公布的48个样片中,Sora展现出令...

辅助患者完善临床决策,GPT-AI提供第二诊疗建议!

患者的疾病被漏诊或延迟确诊每天都发生、可能涉及每个就诊患者。遗憾的是人类医生在所难免的。根据数据估计,每年至少有80万名美国人因误诊而死亡或造成永久残疾。为了避免这些情形继续发生,医生希望利用GPT-...

GPT-5有望今年夏季发布,多模态能力预期提升,中国银河给予计算机行业推荐评级!

AI快讯,中国银河03月29日发布研报称:给予计算机行业推荐(维持)评级。近日,多家媒体公开消息称 GPT-5 预计将在今年夏季正式发布,目前仍处内测阶段。当前,最新版本 GPT-4 Turbo 已能...

周鸿祎:中国垂直领域AI大模型超过GPT-4完全有可能(两会访谈)

从去年初ChatGPT掀起人工智能(AI)大模型热潮,到今年初Sora以文生视频技术惊艳世界,国际尖端人工智能技术迭代迅速。中国该怎么走好自己的AI之路?“我觉得中国还是有优势的。”全国政协委员、36...

OpenAI该放出“GPT-5”了,对手相继突破GPT-4!

终于,GPT-4独霸时代终结了!过去一个月里,四款大模型横空出世,在各项关键基准测试中与GPT-4相匹敌,甚至更胜一筹。谷歌Gemini 1.5突破100万个tokens,是GPT-4的近8倍,此外能...

将发布针对日语进行优化的GPT-4模型,OpenAI官宣在东京开设首个亚洲办事处!

每经AI快讯,OpenAI 4月15日宣布在日本东京设立该公司在亚洲的首个办事处,将业务扩展到亚洲,并将发布针对日语进行优化的GPT-4定制模型。OpenAI称,将致力于与日本政府、当地企业和研究机构...