-
Z世代已准备好“和人工智能共存”
人工智能以令人眼花缭乱的速度改变着一切。大约18个月前,美国科技公司OpenAI推出了人工智能聊天机器人ChatGPT,短短几个月就累积了1亿用户。虽然人们常常陷入科技泡沫,但对生成式人工智能的未来似乎非常笃定。ChatGPT横空出世后,不少人开始把世界划分为“ChatGPT之前”和“ChatGPT之后”两个世界。 人们对人工智能的热衷并非昙花一现。随着人工智能产品不断迭代升级,人们越来越多地感受到其魅力。5月上旬,OpenAI宣布推出新模型GPT-4o,它可以与使用者展开语音对话、识别图像、实…
-
开源模型还是商业模型?阿里云智能张翅提出金融企业选择大模型的6大挑战
大模型发展背景与趋势 大模型是DT时代标志性产物 大模型是数字转型(DT)时代的产物,标志着人工智能技术的一次重大突破,尤其是在自然语言处理(NLP)、图像识别、推荐系统等领域。这些大模型,如OpenAI的GPT系列、Meta的Llama、Google的Gemini,基于Transformer架构,通过消化海量数据集进行预训练,获得了对人类语言、图像等数据的深入理解和处理能力。 AI大模型:人类知识存储、传承和使用方式的一次重构 在数字转型时代,大模型为企业提供了前所未有的机遇,使其能够通过高效…
-
大模型价格普降,互联网式“地盘争夺战”再现 大厂真的会亏钱吗?
今年年初,长文本领域的竞速,让不少国内大模型企业在“内卷”赛道上露了脸。进入5月,这场没有硝烟的战争“烧”到了最粗暴的阶段——降价。从两家海外AI(人工智能)巨头OpenAI和谷歌,到国内字节跳动、阿里、百度、智谱AI、科大讯飞等企业,降价玩家还在“接力”。 单从各方官宣的数据来看,此轮降价一家更比一家力度强,大有“砸穿底价”之势,一度引发业内热议,难道未来API(应用程序接口)调用要“贴钱”引流? 要不要“贴钱”还不可知,但对眼下的大模型企业来说,无论是主动获客还是配合市场被动调整,降价已是大…
-
汽车行业首个群体智能技术白皮书发布,AI Agent助力汽车行业智能化转型
在当前人工智能的发展浪潮中,基于大模型构建的人工智能体(AI Agent)已成为一项领先的技术,引起全球学术界和工业界的高度关注。与此同时,人工智能正从学术领域跨越到实际应用的新阶段,大模型驱动的群体智能技术正成为推动革新的核心动力。目前大模型已能够构建出更具通用性和适应性的智能体,这些智能体不仅能独立执行复杂任务,还能在群体中协同作业,展示出远超单体智能体的集体智慧。可以说,随着新一代AI技术的发展,我们正步入一个由大模型驱动的“Internet of Agents (IoA)”智联网时代,这…
-
AI大模型的十大前景与挑战——解码斯坦福《2024年人工智能指数报告》
人工智能在某些任务上胜过人类,但并非在所有任务上;产业界持续主导人工智能前沿研究;前沿大模型变得更加昂贵;AI 让“打工人”更具有生产力…… 图片来源:匡达/界面新闻 文丨江志强(ViTally AI 创始人) 2024年4月15日,斯坦福大学的“以人为本”人工智能研究所(Stanford HAI),在李飞飞等人的共同领导下,发布了一份名为《2024年人工智能指数报告》(Artificial Intelligence Index Report 2024)的研究报告。 这份报告长达500多页,是S…
-
2024年AI Agent行业报告
在探索未来人机交互的无限可能时,我们是否曾想过,一个由人工智能主导的时代正悄然来临?当AI Agent成为我们日常工作的伙伴,它们将如何改变我们的工作方式和生活模式?这一切听起来似乎遥不可及,但实际上,它正以前所未有的速度成为现实。 今天分享的是《2024年 AI Agent行业报告》,来源:甲子光年智库。 报告概要: 随着大型语言模型(LLMs)的兴起,AI Agent的发展迎来了新的突破。这些智能代理不仅具备自主性、反应性和交互性,还拥有强大的自然语言理解能力,使得它们能够处理复杂的任务和上…
-
港大字节提出多模态大模型新范式,模拟人类先感知后认知
当前,多模态大模型(MLLM)在多项视觉任务上展现出了强大的认知理解能力。然而大部分多模态大模型局限于单向的图像理解,难以将理解的内容映射回图像上。比如,模型能轻易说出图中有哪些物体,但无法将物体在图中准确标识出来。定位能力的缺失直接限制了多模态大模型在图像编辑,自动驾驶,机器人控制等下游领域的应用。针对这一问题,港大和字节跳动商业化团队的研究人员提出了一种新范式Groma——通过区域性图像编码来提升多模态大模型的感知定位能力。在融入定位后,Groma可以将文本内容和图像区域直接关联起来,从而显…
-
刷屏!大模型”翻车”?最新回应来了
竞争白热化的大模型领域争议多。 5月16日上午,有消息称,华为昇腾在近期一场发布会上展示大模型文生图能力时,演示过程中出现Time.sleep(6)代码。在业内人士看来,这一代码意味着“人为控制从输入到输出,过程需要6秒钟”,有人怀疑其图文结果并非大模型生成,而是人为操控,认为该发布会演示“翻车”了。 面对争议,昇腾社区回应称,5月10日,在鲲鹏昇腾开发者大会的一场技术讨论上,我们演示了mxRAG SDK功能。本次演示面向开发者,展示如何通过十几行代码即可完成RAG应用开发。现场图片为实时生成,…
-
生成效果高清逼真!虹软PSAI正式上线AIGC图生视频功能
2024年5月23日,虹软旗下PhotoStudio AI(简称PSAI)智能商拍平台正式上线全新AIGC视频生成功能,旨在助力品牌企业和电商商家提升产品展示效果,进一步升级服装类产品的智慧化营销与推广模式。 随着短视频平台等内容社交媒体的蓬勃发展,视频已成为商品线上传递信息、吸引受众的主要营销方式。无论是企业品牌推广,还是线上电商产品展示,对视频生成的需求都在持续增长。然而,传统的视频制作过程繁琐、成本高昂(高达100-500元/条),对设备和技术要求还很高,成为许多品牌企业和线上电商运营的痛…
-
谷歌发布Gemini,负责人:原生多模态大模型是AI「新品种」
又是一个不眠之夜,神仙扎堆献技。 当地时间 12 月 6 日,谷歌 CEO Sundar PichAI 官宣 Gemini 1.0 版正式上线。在此之前,这款被谷歌寄予厚望对抗 OpenAI 的武器,发布时间一直被拖延。 未曾料到,来得如此猝不及防。 研发负责人、谷歌 DeepMind CEO Demis Hassabis 代表 Gemini 团队在发布会上正式推出大模型 Gemini,它拥有「视觉」和「听觉」,还有学习和推理能力。作为谷歌迄今为止最强大、最全面的模型,在大多数基准测试中, Ge…
