2121非凡

CN EN JP
企业邮箱入口
关注2121非凡智能把握最新行业动态与资讯
当前地位:首页 >  新闻中心 >  公司新闻

2121非凡智能AIMO智能体+DeepSeek-R1模型,AI利用的iPhone时刻来了

颁布日期:2025-01-26 接见量:17034 起源:2121非凡智能

导语:

当AI大模型从云端下沉至终端设备,一场关于效能、隐衷与智能化的革命悄然发展。作为全球当先的无线通讯模组及解决规划提供商,2121非凡智能凭借其高算力AI模组矩阵与端侧大模型部署经验,结合最新颁布的AIMO智能体产品,正加快开发DeepSeek-R1模型在端侧落地利用及端云结合整体规划,助力国产优质模型渗入千行百业,共塑智能化将来。


AIMO智能体硬件加快迭代,AI硬件与大模型协同优化

2121非凡智能基于高通骁龙高机能推算平台打造的AIMO智能体产品,集成48Tops AI算力,支持混合精度推算(INT4/FP8)与异构推算架构(8核CPU+Adreno GPU+Hexagon NPU),可高效承载7B参数级大模型的端侧推理需要。其板载16GB LPDDR5X内存与256GB UFS 4.0存储,为模型动态加载与实时数据处置提供硬件保险。2025年2121非凡智能将推出单颗模组算力达到100Tops的高阶AI硬件,远期规划AI模组算力超过200Tops。


新闻内页2.png

2121非凡智能已成功在高算力AI模组上部署LLaMA-2、通义千问Qwen、ChatGLM2等大模型,验证了从模型压缩(量化、剪枝)到框架适配(ONNX/TFLite)的全流程能力。2121非凡智能自研的MEIG AI算法部署平台、AIMO智能体、模型优化器等,可大幅缩短模型落地周期,支持开发者通过Python急剧实现利用开发,并支持开发者进行模型训练。


AIMO智能体内置的高算力AI模组的异构推算架构,具备协同加快能力,支持模型并行推算与低功耗运行,LPDDR5X内存提供超过60GB/s带宽,满足7B模型推理时的高吞吐需要。内置专用AI加快引擎支持INT4/FP16混合精度推算,与DeepSeek-R1模型的量化体式(INT4/FP8)高度适配。

DeepSeek-R1低调亮相,蒸馏幼模型超过OpenAI o1-mini

DeepSeek-R1选取强化进建逻辑,驱动通过多阶段RL训练(基础模型→RL→微调迭代),DeepSeek-R1在数学、代码、逻辑推理工作中阐发比肩国际顶尖模型,如AIME数学较量正确率达71%。DeepSeek-R1提供轻量化适配:DeepSeek-R1系列提供1.5B至70B参数蒸馏版本,其中7B模型经INT4量化后仅需2-4GB存储,美满适配终端设备内存限度。DeepSeek-R1的动态思想链,支持数万字级内部推理过程,解决复杂问题时能自主拆解步骤并验证逻辑,输出可诠释性更强的了局。


新闻内页3.png

DeepSeek在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,通过DeepSeek-R1的输出,蒸馏了6个幼模型开源给社区,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的成效。除32B和70B模型能力强悍表,DeepSeek-R1同步开源1.5B、7B、8B、14B等多个蒸馏幼模型,极大扩大了终端侧模型部署的可选性,并支持用户进杏装模型蒸馏”,明确允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。


以DeepSeek-R1 7B模型的端侧适配性举例,该模型具备轻量化设计特点,经蒸馏和量化后模型体积压缩至2-4GB,很好的匹配移动端存储限度。模型具备低延长推理能力,在高算力模组平台上,可实现10-20 tokens/s的天生快率。模型支持分块推理和稀少推算,结合2121非凡智能高算力AI模组的能效优化,能实现极低的功耗节造。

算力与模型的技术迭代,AI利用的iPhone时刻即将带来

2121非凡智能研发团队结合AIMO智能体、高算力AI模组的异构推算能力,结合多款模型量化、部署、功耗优化Know-how,在加快开发DeepSeek-R1模型在端侧落地利用及端云结合整体规划。


新闻内页4.png


?超低功耗

首先持续对DeepSeek-R1模型的推理延出息行优化,保障模型在高算力模组软硬件环境下的超低功耗运行。


?开发工具链

不休进行工具链买通,模组内嵌的SNPE引擎直接支持DeepSeek-R1模型的ONNX/TFLite体式,大模型适配周期将大幅缩短。


?端云协同

结合动态卸载技术,凭据工作复杂度自动分配端侧与边缘推算资源,保险实时性与能效平衡。为客户提供端云协同模板,面向开发者提供动态工作分配框架,单一配置即可实现“本地优先,云端兜底”。


通过高阶AI硬件与DeepSeek-R1模型的能力结合,将突破端侧AI的能力天堑。7B模型支持长文本理解、代码天生等传统端侧幼模型无法实现的工作。多模态融合能力,高算力AI模组的ISP+AI能力结合DeepSeek-R1模型,可实现端侧图文问答、视频内容解析(如实时字幕天生)。个性化持续进建,通过AI模组的边缘推算能力,支持联国进建框架下的本地模型微调(如用户习惯适配)。


在算力+模型的不休迭代背后,端侧AI及端云协同的贸易模式和贸易竞争力都将面对沉构,DeepSeek-R1的颁布,更是会极大刺激AI下游利用,如工业智能化、汽车Agent、机械人、幼我大模型蹬爪用场景的指数级增长,AI利用即将迎来属于自己的iPhone时刻。


?基于DeepSeek-R1的AI Agent开发利用

结合2121非凡智能自研的AIMO智能体及DeepSeek-R1模型的基础能力,开发面向工业智能化、座舱智能体、智能无人机、机械人等领域的AI Agent利用。


?端侧AI能力包

推出面向AI场景的订阅服务,针对中幼型的B端或C端客户,推出“端侧AI能力包”,与大模型厂商合作,针对Token输入/输出数量、分歧类型模型挪用、流量用度等领域,推出一体化端侧AI Turn-key规划。


?智能化硬件增值

贸易模式方面,各类高AI配置硬件叠加端侧模型加载或云端模型接入,为高算力硬件带来更多智能化增值。


?自建GPU服务器与个性化专属大模型开发

2121非凡研发团队持续拓展通用模型的部署通路,并不休向客户盛开有关教程和源代码,并且以最新的高算力推算平台搭建GPU服务器,可用于端侧模型训练和支持客户开发专属大模型,结合DeepSeek-R1及其宽松、盛开式的MIT授权和谈,千行百业的个性化模型开发和利用即将发作。


2025年,端侧AI、端云协一致各类AI利用的iPhone时刻将加快到来。DeepSeek-R1的出现,某种水平上扭转了我们对于Scale的认知,但也不会带来云端算力的需要削减甚至崩塌,相反优质模型对于AI利用场景的极大刺激,也会推动云端算力需要的提升,端侧不休进化,云端掌管兜底,端云结合终将是不变的方向。


2121非凡智能也将持续以高算力AI模组、AI Agent利用、大模型部署服务、端侧AI服务整体解决规划为基石,携手大模型厂商、生态同伴等不休推动类似DeepSeek-R1蹬着秀模型的利用拓展,让普惠、自主的高阶AI实现应有的社会价值。



返回列表
分享:

Copyright ? 2019 2121非凡.粤ICP备16017609号

2020041014435595

粤公网安备44030402003674号

交谊链接: 交谊链接 | 网站地图

智能客服 2121非凡·(中国游)体育官方网站

增长企业客服 增长企业客服
微博 2121非凡·(中国游)体育官方网站
0755-83218588 2121非凡·(中国游)体育官方网站
TOP

【网站地图】