开云(中国)Kaiyun·官方网站 - 登录入口

欧洲杯体育英飞流独创东说念主兼CEO张颖峰-开云(中国)Kaiyun·官方网站 - 登录入口

发布日期:2024-12-24 03:05    点击次数:56

欧洲杯体育英飞流独创东说念主兼CEO张颖峰-开云(中国)Kaiyun·官方网站 - 登录入口

智东西12月6日报说念,为期两天的2024中国生成式AI大会(上海站)当天圆满收官。

两天内,51位产学研投嘉宾代表密集输出干货爆棚,大会报名究诘东说念主数超4000东说念主,至极1200位不雅众到场参会。其中,在主会场进行的大模子峰会、AI Infra峰会的线上不雅看东说念主次更是至极104万。

现场参会不雅众们的照应十分激越,主会场、分会场济济一堂,展览区近邻的产业相通也十分活跃,15家企业的诸多新家具新工夫都引起了无为关注和谋划。

▲大会展区

这次大会以“智能跃进 创造无穷”为主题,51位产学研投嘉宾代表基于前瞻性视角解构和把脉生成式AI的工夫家具创新、生意落地解法、畴昔趋势走向与前沿估计焦点。

今天的AI Infra峰会上,副素养、无问芯穹聚合独创东说念主兼首席科学家戴国浩以为,业界更应该关注单元算力何如完毕更高效的token模糊,大模子实质可用算力不仅取决于芯片表面算力,还可通过软硬协同优化提高算力利用服从,通过多元异构适配放大合座算力鸿沟。

北电数智智算云负责东说念主郭文,GMI Cloud亚太区总裁King.Cui,阿里云智算集群家具治理决议负责东说念主丛培岩,中昊芯英芯片软件栈负责东说念主朱国梁,光羽芯辰独创东说念主兼董事长周强永别对全栈AI工场、AI企业出海何如补王人算力短板、高性能智算集群、国产TPU芯片“No CUDA”软件栈、通向个东说念主大模子之路几个主题进行了分享。

枫清科技独创东说念主兼CEO高雪峰,声网生成式AI家具负责东说念主毛玉杰,腾讯云向量数据库工夫负责东说念主谢宇,Jina AI聚合独创东说念主兼首席工夫官王楠,Zilliz搭伙东说念主、研发VP栾小凡,英飞流独创东说念主兼CEO张颖峰,Alluxio首席架构师父正佳永别针对“从数据到学问:AI重塑百行千业的基石”、“生成式AI驱动实时互动的工夫变革与体验革新”、“TencentVDB向量数据库”、“RAG范式下AI Infra的机遇和挑战”、“RAG虽强,但向量数据库绝非万仙丹”、“新一代企业级多模态RAG引擎”、“高性能AI数据底座”带来了精彩演讲。

下昼场的圆桌谋划聚焦“大模子行至深水区,AI Infra的新变化与新契机”,由德联本钱引申董事刘景媛主捏,Alluxio首席架构师父正佳,Zilliz搭伙东说念主、研发VP栾小凡,英飞流独创东说念主兼CEO张颖峰三位嘉宾给出了我方的真知卓见。

大会首日,17位嘉宾泛论诳言语模子、多模态大模子、具身智能、AI原生应用、音乐生成、3D AIGC、AI智能体的行业应用、垂类行业大模子等前沿议题。

除了大会首日主会场进行的大模子峰会,以及今上帝会场的AI Infra峰会,大会分会场也在这两天永别组织了端侧生成式AI工夫接头会、AI视频生成工夫接头会与具身智能工夫接头会,17位后生学者和工夫民众带来了酬报分享,后续将会上架这三场收费制接头会的回放。

一、从智算集群到原生加快工夫栈,聚焦产业落地痛点冲破大模子算力瓶颈

AI的发展带来了巨大的数据、算力以及动力挑战,动作相沿大模子运行以及生成式AI应用开发的重要,AI Infra也走到了台前,发展势头强盛。

何如打造优质的智算中心,何如完毕AI从芯片到应用端全产业链的高效协同?多位嘉宾给出了我方的深入观点。

1、上海交通大学副素养、无问芯穹聚合独创东说念主兼首席科学家戴国浩

Scaling Law之下,数据成为制约AI络续发展的身分之一。以GPT-o1为代表的推理模子不错冲破数据瓶颈,但缱绻范式的移动使算力需求呈指数级增长,可能导致硬件系统能耗支拨供不应求,对行业的可捏续发展组成挑战。

对此,戴国浩素养指出,当下业界更应该关注单元算力何如完毕更高效的token模糊,让大模子的实质可用算力不仅取决于芯片表面算力,还可通过软硬协同优化提高算力利用服从,并通过多元异构适配放大合座算力鸿沟。他分享了其估计团队在软硬协同、多元异构与端侧智能方面的估计进展与落地收尾,这些收尾能助力行业教育面向大模子场景的token模糊服从。

2、北电数智郭文:以AI工场填补国产算力供给侧与需求侧的产业链断层

“产业要发展,创新不可仅仅停留在工夫层面,更要从历程、系统和组织进行全面的创新。”北电数智智算云负责东说念主郭文分享了从算力、算法、数据与生态方面全面构建东说念主工智能期间AI坐蓐线的践诺想考。

郭文称,当下国产芯片落地东说念主工智能产业的最大问题是,算力供给侧与需求侧之间存在产业链断层。为此,北电数智推出首个“国产算力PoC平台”,以北京数字经济算力中心为载体打造具备全栈能力的AI工场,全线适配与拉通场景、模子到芯片层面,激动智算中心从成本中心漂流为激动地区发展新质坐蓐力中心。

3、GMI Clould King.Cui:高踏实GPU集群成AI企业公共化布局重要

中国AI出海加快,算力动作其中的中枢坐蓐良友正阐述迫切作用。高踏实性的GPU集群能降本增效,匡助企业在AI公共化波浪中取胜。

GMI Cloud亚太区总裁King.Cui提到,为确保GPU集群的高踏实性,他们使用了具备主动检测功能的自研云集群引擎,完毕缱绻、存储和网罗资源的高效调配。

GMI Cloud是NVIDIA Top10 NCP,托付前会进行严格的考证历程。GMI Cloud与IDC互助,提供备件和维修,领有更短的托付时辰,确保停机时辰最小化。

4、阿里云丛培岩:灵骏智算集群不仅要完毕踏实性和极致性能,更要在不同维度支捏鸿沟的极致扩张

阿里云智算集群家具治理决议负责东说念主丛培岩预计,畴昔模子性能还会随参数,数据集和算力的增长络续教育,Scaling Law仍有增漫空间,AI智算集群的遐想范式转向要以GPU为中枢。

阿里云推出支捏超大鸿沟散播式训导的灵骏智算集群,可达到10万卡扩张鸿沟,千卡鸿沟线性加快比达到96%;阿里云自研磐久职业器接纳CPU和GPU分离,完毕单机教育至16颗GPU;网罗架构HPN7.0最大鸿沟可相连10万颗GPU。

智算集群踏实性至关迫切,阿里云3千卡鸿沟智算集群,在一个月内踏实训导时长占比达99%。

5、光羽芯辰周强:治理“大模子不懂你”问题,个东说念主大模子迎来机遇

动作与通用大模子、行业大模子、企业大模子并行发展的一大分支,个东说念主大模子也参预了快速发缓期。光羽芯辰独创东说念主兼董事长周强称,个东说念主大模子治理的是“大模子不懂你”的问题,随入辖下手机、PC、可一稔、XR等端侧开辟厂商All in AI,个东说念主大模子之路将越走越宽。

他提到,个东说念主大模子也称为端侧大模子,期待治理端侧智能体在性能、功耗和成本方面的痛点,让确切的AI手机走进生存。端侧AI具备实时性、可靠性、成本低、秘密保护和定制化五大优势。当今,构建端侧大模子的中枢是治理存储带宽和容量双重问题。

6、中昊芯英朱国梁:国产TPU芯片“No CUDA”软件栈的构建践诺

中昊芯英芯片软件栈负责东说念主朱国梁先容了他们在为国产TPU芯片构建“No CUDA”软件栈的践诺教导。

中昊芯英一瞬芯片接纳VLIW提醒集架构,面对强壮的CUDA生态,他们一一治理了库、并行缱绻与编程方面的问题,全自研用户态和内核态驱动,完毕了芯片的高效管制。

为作念好生态兼容,中昊芯英底层软件栈兼容PyTorch以及整个主流训推框架,当今,中昊芯英可提供定制的端到端的云智算治理决议,并支捏国产操作系统。

二、从企业智能体、向量数据库到RAG,AI Infra基础软件涌现诸多新挑战

下昼场,多位嘉宾进一步分享了AI Infra领域对于智能体开发管制平台、实时语音、向量数据库、向量模子、RAG工夫、数据编排等方面的行业不雅察和深入观点。诸多新平台、新家具、新工夫走上前台,赋能产业。

1、枫清科技高雪峰:从数据到学问,逾越生成式AI与决策智能间的鸿沟

枫清科技独创东说念主兼CEO高雪峰谈说念,要将生成式AI确切应用到企业决策场景中,弥合其与决策智能之间鸿沟的工夫冲破点,等于在推理框架侧和会记号逻辑推理。

企业智能化落地需要濒临数据孤岛、数据整合、学问校验、数据实时效等工夫挑战。枫清科技不错为企业提供学问引擎与大模子双轮驱动的新一代智能体平台,通过构建全链路优化体系,匡助企业教育数据质料,将企业腹地数据学问化,并和会大模子千里淀的泛化能力,在学问网罗之上进行记号逻辑推理,完毕可证明的智能,进而使AI在多个场景下能够完毕精确、透明的决策支捏,激动企业智能化转型的顺利实施。

2、声网毛玉杰:生成式AI+实时互动,让东说念主机交互变成确切的心灵交互

声网生成式AI家具负责东说念主毛玉杰论述了生成式AI出现后实时互动(RTE,Real-Time Engagement)工夫和体验的变迁。

毛玉杰先容,2014年于今十年,RTE从职业质料走向体验质料;2025年运行,在生成式AI发展的配景下,RTE向AI RTE变革,运行珍摄跨模态体验质料,作念多模态交互、跨模态退换,为东说念主和模子而遐想,给大模子厂商提供眼睛、耳朵和声息能力。

毛玉杰说,当今东说念主机对话还是达到“听得懂”的景况,期待下一步完毕“听得心”——让东说念主机交互变成确切的心灵交互。

3、腾讯云谢宇:向量数据库助力企业挖掘更大数据价值

AI期间,向量数据库(VDB)脱颖而出,成为相连结构化与非结构化数据的要津。关联词,当VDB被诈欺于RAG场景时,多款开源RAG架构出现了调回率低的问题。

腾讯云向量数据库工夫负责东说念主谢宇先容,为治理上述挑战,腾讯当先教育了复漫笔档的识别效果,并对数据处理、Embedding、检索、归来等其他秩序进行优化,最终完毕了90%以上的调回率。

腾讯自研向量检索引擎OLAMA已上线5年,日均处理8500亿次检索恳求。畴昔,他们还将在性能、成本、业务效果、容灾率等方面发力,捏续教育家具进展。

4、Jina AI王楠:长文本大模子、RAG弥远共存,长窗口向量模子濒临两大挑战

大模子存在幻觉、无法保证出奇数据安全、推理成本高三大问题,Jina AI聚合独创东说念主兼首席工夫官王楠以为,RAG恰是通过迁延大模子生成范围,保证检索准确性、完毕收尾可溯源,是以长本文大模子不会取代RAG,二者将弥远共存。

短窗口会导致转折文配景信息丢失,因此RAG需要长窗口向量模子支捏。但长窗口向量模子濒临两大挑战,一是推理成本和内存浮滥会随窗口长度呈平素线性增长,分享GPU是治梦想路之一;二是长窗口使模子无法好意思满暗意细颗粒度语义,解法是增多向量维度和多向量暗意。

5、Zilliz栾小凡:向量数据库落大地临成本及扩张性挑战,RAG转为Graph RAG

Zilliz搭伙东说念主、研发VP栾小凡分享了向量数据库当今濒临的挑战以及相应治理决议。

栾小凡称,2025年重生成的数据中,将会有80%以上瑕瑜结构化数据。在这一数据压力下,向量数据库的落大地临着成本以及扩张性等方面的各样挑战。而当今的RAG存在搜索质料难、处理长尾查询能力差、收尾难以证明和划定、向量存储成本高级问题。

据此,栾小凡过火团队提议了两个治梦想路:一是夹杂查询,在单个系统内支捏密集镶嵌、寥落镶嵌和词汇搜索;二是Graph RAG,将学问图谱和向量检索联接起来。

6、英飞流张颖峰:多模态RAG新范式

英飞流独创东说念主兼CEO张颖峰以为,RAG动作LLM期间的数据库,当今濒临着三大挑战——多模态文档处理、检索、语义鸿沟。

针对第一个问题,英飞流训导了深度文档和会模子,能对复漫笔档中的多模态内容进行分类处理。而在检索这一RAG“临了一公里”的问题上,英飞流使用三路调回决议,并增多张量索引进行重排序,这一决议在多模态RAG上展现出彰着优势。

临了,针对检索过程中的语义鸿沟,英飞流使用GraphRAG抽取学问图谱,并与原数据进行聚合检索,教育检索质料。

7、Alluxio傅正佳:零校正、无侵入计谋,打造高性能AI数据底座

Alluxio首席架构师父正佳谈到了教育大鸿沟模子训导服从的两大挑战:一是数据鸿沟束缚增长、类型更多元化,因此处理数据需要教育算力有用利用率;二是当数据喂到训导平台上,数据IO拜谒瓶颈会导致算力处于低利用率景况。

这一配景下,Alluxio提供了调和的数据视图、丰富条约漂流、高性能数据拜谒,以打造合座数据职业。其决议通过零校正、无侵入计谋,不错使算法工程师仍按原有容貌责任,无需改变已有剧本,而况客户还是有的多数存量数据不需要进行出奇化条约校正。

三、AI 2.0期间,大模子行至深水区,AI Infra迎来变革

在圆桌论坛秩序,几位嘉宾分享了对于“大模子行至深水区,AI Infra的新变化与新契机”这一主题的行业知悉,以及各自公司的家具和工夫是何如治理AI应用中的核肉痛点的。

动作主捏东说念主的德联本钱引申董事刘景媛提到,两年前,ChatGPT将生成式AI推到台前,迎来AI 2.0期间,Scaling Law和数据量的大鸿沟增长给AI Infra带来了至极大的增量契机。两年后的今天大模子行至深水区,AI Infra在匡助大模子及有关家具的落地的过程中,家具鸿沟和功能需求逐渐了了。

▲刘景媛

对于Infra这类研发周期长、工程复杂进程高的软件家具,开源社区简略不错孝敬一些能量,使家具迭代及工夫选型更贴合实质需求,同期教育名堂本人的关注度和影响力。

另外,“go global”也险些成为Infra软件的必选项,一方面有生意的考量,另外中国工程师的勤勉和工程攻坚能力公共有目共睹。值得关注的是,在资源有限的情况下也要作念好弃取(不管是功能方面照旧业务方式方面)。

Zilliz动作向量数据库企业,其家具不错处理大体量非结构化数据,挖掘数据价值。对AI 2.0期间的需求变化,Zilliz搭伙东说念主、研发VP栾小凡以为,AI工夫在前年被高估、本年被低估,往后看AI落地还需要等一个契机,这亦然整个这个词范式的发展契机。

谈到开源,栾小凡欷歔说念,Zilliz当今正处于最具挑战的阶段,一方面要让家具知足客户需求,另一方面要让家具变现。

▲栾小凡

当下,AI Infra公司出海还是成为必答题。栾小凡以为出海的前提条目等于家具要有先发优势,在扩张性、功能等方面碾压竞品。家具定制方面,栾小凡的不雅点是Zilliz险些不作念定制。原因在于其所处的赛说念还是满盈大,莫得必要执着于将我方打变成大而全的平台。

AI期间,数据量的暴增对存储提议巨大挑战。Alluxio首席架构师父正佳先容,他们通过散播式数据编排软件系统,高效相连存储与缱绻。Alluxio很早就凝视到存算分离的趋势,并在数据长途拜谒秩序重心发力,回话了AI存储挑战。

Alluxio的存储系统兼具开闭源版块,傅正佳以为开源匡助他们保捏了与工夫前沿的同步,也打出了闻明度,但他们也濒临着生意化和部分开源用户孝敬进程低的问题。Alluxio当今正积极出海,傅正佳分享,海表里团队的优势互补与家具的腹地化是其中的重要。

▲傅正佳

英飞流独创东说念主兼CEO张颖峰称,RAG用起来很容易,但作念好至极辛勤。公司能作念成RAG的中枢在于,把作念系统的东说念主和作念AI的东说念主和会在了一说念去作念家具。

谈及开源,张颖峰说,开源是生意化的一种计谋,而不是为了开源而开源;为了出海必须开源,但创业第一天就要想显着家具企业版和开发者版之间的区别。

▲张颖峰

当今英飞流的Infra家具还莫得参预生意化阶段,联接过往创业经验,张颖峰称,生意化过程中,独创东说念主必须对每个家具的特色和定制化的鸿沟有至极深入的意志。

结语:生成式AI产业化落地加快,上中卑劣全产业链呼叫合作共赢

昔时一年,生成式AI的发展渡过了波涛壮阔的一年,整个这个词产业链成为公共创新、投资和应用最活跃的领域之一,每位参与者都在与时辰竞走。

Sora掀翻视频生成上升,多模态天下模子的估计热度渐起。更具编削性的推理模子o1悄然出世,基座诳言语模子不再捏续狂飙,不仅价钱战、营销战硝烟燃起,融资热度降温,Scaling Law是否撞墙更是在年底激发烧议。

行业赋能捏续进行,包括智能体在内的应用层的兴起仍然备受期待。同期,大模子向边端下千里的趋势日趋彰着,AI手机、AI PC等AI硬件纷纷站优势口。不啻AI硬件,大模子驱动下的具身智能更是热度空前,东说念主形机器东说念主正开启星辰大海。

动作智能产业的弥远不雅察者,咱们期待见证并记载中国生成式AI波浪之变,并将捏续邀请这股波浪中的新力量们,分享他们最新的工夫进展与生意化探索。

跟着当天为期两天的2024中国生成式AI大会(上海站)圆满收官。2025年线下大会也将厚爱启动,除了1月14日的公共自动驾驶峰会,围绕AI芯片、生成式AI等领域的线下大会也已筹备上了,敬请期待。



热点资讯
相关资讯