Deprecated: Creation of dynamic property db::$querynum is deprecated in /www/wwwroot/www.591mdn.com/inc/func.php on line 1413

Deprecated: Creation of dynamic property db::$database is deprecated in /www/wwwroot/www.591mdn.com/inc/func.php on line 1414

Deprecated: Creation of dynamic property db::$Stmt is deprecated in /www/wwwroot/www.591mdn.com/inc/func.php on line 1453

Deprecated: Creation of dynamic property db::$Sql is deprecated in /www/wwwroot/www.591mdn.com/inc/func.php on line 1454
“意念”控制机器人!创新奇智新模型AInno-75B放大招能看视频能画CAD还外接脑机接口_开云全站app/kaiyun官方下载/开云网页版登录入口
 

新闻动态

“意念”控制机器人!创新奇智新模型AInno-75B放大招能看视频能画CAD还外接脑机接口
首页 > 新闻动态 > 企业动态
来源:开云全站app    发布时间:2024-08-09 15:48:10

  智东西3月27日报道,今日,国内“AI+制造”解决方案供应商创新奇智宣布其“奇智孔明AInnoGC”工业大模型产品矩阵升级。

  创新奇智CTO张发恩发布了升级后的工业大模型AInno-75B,以及三款全新ChatX系列生成式AI应用:包括生成式企业私域视觉洞察应用ChatVision、生成式辅助工业设计应用ChatCAD、基于非侵入式脑机接口的工业机器人任务编排应用ChatRobot Pro。

  创新奇智于去年9月发布了自研工业大模型AInno-15B,基于该模型的大模型服务引擎,以及三款生成式AI应用产品:ChatRobot、企业私域数据分析应用ChatBI、企业私域知识问答应用ChatDoc。本次发布,大模型服务引擎和ChatX系列应用也基于750亿参数的模型进行了升级。

  现场,创新奇智副总裁郭江亮、创新奇智高级首席技术官温哲立、创新奇智高级研究员高达辉分别演示了ChatVision、ChatCAD和ChatRobot Pro,其中,脑机接口“意念取物”的演示令人印象深刻。

  张发恩首先发布了750亿参数的工业大模型AInno-75B,相比半年前发布的Ainno-15B,参数提升至5倍,模型性能也相对升级。

  AInno-75B还新增了多模态解决能力,支持输入文本、图像、视频、EEG(脑电波)以及工业场景中的特定模态,如CAD(计算机辅助设计)等。

  输出方面,AInno-75B支持输出文本、图像、视频、CAD,以及工业领域特色的Action(行为)模态。

  在能力指标方面,AInnoGC工业大模型已获得中国信通院可信AI工业评测的最高等级4+级,也是截至今天唯一通过该等级评测的工业大模型。

  在去年12月麻省理工科技评论发布的15个“中国AI大模型先进应用案例”中,AInnoGC榜上有名。SuperCLUE工业大模型第一名。

  3月21日,中文语言理解测评基准SuperCLUEC发布首个中文原生的工业大模型测评基准SC-Industry,奇智孔明AInno-15B仅次于GPT-4 Turbo和GPT-4,在国内工业领域大模型中位列第一。

  生成式企业私域知识问答应用ChatDoc针对性优化了知识构建、问答、溯源和推荐能力,整体问答效果提升28.8%;生成式企业私域数据分析应用ChatBI新增支持Excel、CSV等数据格式,生成SQL语句和分析报告的准确率提升15%。

  大模型服务引擎Engine则新增支持交互式生成Agent应用,其RAG(检索增强生成)能力引擎也增加内置针对性优化策略,模型服务新增内置大模型推理加速引擎。

  会上,张发恩还发布了三款新的ChatX系列新产品,分别是生成式企业私域视觉洞察应用ChatVision、生成式辅助工业设计应用ChatCAD,以及基于非侵入式脑机接口的工业机器人任务编排应用ChatRobot Pro。

  据介绍,ChatVision以自然语言交互形式,对视频/图片进行交互式智能分析,并且基于Agent能力自主进行任务规划和技能编排。

  创新奇智副总裁郭江亮现场演示了ChatVision的场景洞察能力,其可以有效的进行实时视频流分析、理解用户的复杂任务指令,也能离线进行视频长文件分析。

  首先,两位工作人员在现场扮演工人的角色,通过摄像头拍摄实时视频流输入ChatVision后,郭江亮通过语音输入指令“观察当前画面,告诉我这可能是啥地方”。随后,ChatVision迅速给出答案,通过一系列分析场景中的人物和穿着,判断这可能是一个建筑施工工地、车间或仓库。

  随后郭江亮追问,让ChatVision找出画面中的电源插座和白色安全帽,它也很快就完成并进行了实时跟踪。

  郭江亮又提出分析画面中有什么潜在的危险行为并发送给管理员,ChatVision在画面中标出了玩手机等3项违规操作,并截图发送了警告邮件。

  除了在线分析视频流,ChatVision也能离线分析视频长文件。郭江亮上传了一个车间实拍视频,并询问ChatVision这是什么场景,很快就得到了正确的回答。

  随后郭江亮输入指令“识别是否有人吃饭”,ChatVision通过一系列分析,指出在视频0-15秒有工人在车间吃饭的行为,还详细描述了“用筷子”“喝汤”等具体动作。

  最后,郭江亮输入“退出”回到视频流模式,并将摄像头转向现场的观众,让ChatVision识别出正在微笑的人,ChatVision很快在画面中画出一个个红框圈出目标。

  接触过工业制造的读者必须要知道,CAD几乎是整个工业的基础。面向CAD设计场景,创新奇智退出ChatCAD,支持以语言交互的方式生成机械、电气设计,变革了设计方式并提升设计效率。

  创新奇智高级首席技术官温哲立现场演示了ChatCAD,通过简单的自然语言输入就能得到复杂的工业设计模型,还能进一步提出提出修改要求,生成模型兼容多种主流CAD格式。

  ChatCAD界面基于AI原生原理打造,没有复杂的菜单,其左边是设计区,右边是对话区。

  温哲立首先让ChatCAD生成一个工业滑轮,给出了具体的参数。不出一分钟ChatCAD就生成了相应的模型。

  随后温哲立接连提出两个要求,让ChatCAD修改滑轮中心轴半径、边缘凸出部分长度,很快便得到了满足要求的生成结果。

  温哲立又让ChatCAD设计了一个直流电机,并再次提出2个追加要求,ChatCAD均正确生成。

  第三个演示中,温哲立提出了一个极为复杂的需求,要求ChatCAD生成一个涡轮机,对其扇叶数量、涡轮轴直径、旋转轴轴帽长度等多项参数都进行了具体数据要求。

  最后温哲立选择STEP格式下载了该模型,它可以在相应CAD软件中完美兼容。

  ChatRobot Pro在ChatRobot的基础上,采用非侵入式脑电采集,对人脑电波进行解码,实现通过意念控制机器人完成多样化任务。

  创新奇智高级研究员高达辉演示了ChatRobot Pro,由一位现场工作人员连接外接脑机接口装置,抓取目标商品并由机器人达成目标设定。

  在ChatRobot Pro工作界面中,左边显示脑电信号实时状态,右边是交互页面。

  据介绍,该任务的主要难点在于非侵入式脑机接口反映的是整体脑电波,无法直接反映局部意念,大模型需要从中解码用户的具体意图。

  首先,工作人员通过大脑“意念”控制光标移动,选择了一种饮料,系统将命令下发给机器人。

  得到指令后,ChatRobot Pro自动完成了任务解析和步骤编排,并驱动机器人前往货架选择饮料。

  随后,机器人在ChatRobot Pro的控制下,通过视觉解析找到目标位置,前往高达辉面前,将饮料交到他手里。

  完成任务后,高达辉向ChatRobot Pro输入“让机器人归位”的指令,ChatRobot Pro便规划了任务规划并驱动机器人回到初始位置。

  就在昨天,工信部在国新办新闻发布会上提到,加快推进以大模型为代表的AI赋能制造业发展。今年将开展“人工智能+”行动,促进AI与实体经济深层次地融合,推动AI赋能新型工业化。

  创新奇智坚持深耕“AI+制造”领域,着眼于AI解放制造业,其工业大模型产品矩阵的行业价值正在慢慢地展现,为公司实现数字化转型提供了有力支撑。能预见到,此次发布的模型升级与三款新产品,将在工业领域产生更多创新场景,为制造行业提供丰富的生成式AI解决方案。