质量超越o1,UCSD张怡颖教授团队开源生成式AI工作流自动优化器
gaoyangw 2025-04-30 16:30 9 浏览 0 评论
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
近几年在生成式 AI 技术和商业创新飞速发展的背景下,创建高质量且低成本的生成式 AI 应用在业界仍有相当难度,主要原因在于缺乏系统化的调试和优化方法。
近日,UCSD 张怡颖教授的 GenseeAI 团队推出了首款可自动提升 AI 工作流生成质量并降低生成成本的工具 Cognify。Cognify 可以自动优化 AI 工作流,支持 LangChain、DSPy、Python 等语言框架。Cognify 的核心思路是一种创新的分层工作流级优化方法。Cognify 可将生成式 AI 应用的生成质量提高多达 48%,并将执行成本降低多达 90%。Cognify 现已开源。
开源地址:https://github.com/GenseeAI/cognify
生成式 AI 工作流
当前的生成式 AI 产品通常都是以生成式 AI 工作流的形式构建和部署。AI 工作流内部可以调用各类 AI 模型、工具、数据源及其他类型的系统。典型的 AI 工作流包括 Agent 工作流和 LLM+RAG 等。
与单次调用 AI 模型相比,AI 工作流提供了更强大、可定制和集成化的解决方案。当前业界的 AI 工作流通常由工程师编写。在部署之前,工程师需要手动调整 AI 工作流的结构和提示词(prompt),并为工作流中的各个步骤选择合适的模型。
然而,由于缺乏系统化的调优方法,AI 工作流的部署经常非常耗时,已部署的工作流也可能面临质量不佳、不稳定或成本太高等问题。虽然有许多生成式 AI 工作流的开发框架,比如 Coze,Dify,LangChain,DSPy 和 Claude MCP,但是并没有可以帮助开发者系统调试和优化工具。
Cognify 优化器
Cognify 是一款全面、多目标的开源 AI 工作流优化器。Cognify 的优化过程基于自动选择 AI 模型、改进工作流结构和增强提示词。Cognify 实现了工作流的多目标优化,包括提高生成质量和低生成成本。
对于不同的应用场景,Cognify 都用相同或更小的模型达到了更高的生成质量,推动了质量 - 成本 Pareto 边界,并且允许用户选择不同的质量 - 成本组合(结果如下图所示)。在此过程中,Cognify 的优化实现了「一键」全自动化。
同时,Cognify 也允许用户自定义优化方法 Cogs(Cognify 把各种优化统称 Cog),备选模型种类,以及最多优化次数。Cognify 目前支持 LangChain、LangGraph、DSPy 和基于 Python 开发的工作流。
Cognify 核心技术
全局级别的工作流超参数调优
Cognify 的核心理念是对整个工作流进行优化,而不是在每个单独的工作流组件中进行优化。由于上游组件的生成结果对下游组件的性能有重大影响,孤立的优化各个组件可能导致最终生成质量不佳,而且整体运行成本增加。
Cognify 通过实验各种 Cog 组合,并通过最终生成的质量评估这些组合的效果,从而优化整个工作流。
在整体工作流优化中,一个关键挑战是优化成本,包括模型运行成本和耗时。一个简单的做法是对每个可能的 cog 组合进行网格搜索,但这会导致指数级增长的优化成本。为了解决这个问题,Cognify 采用了两种策略。
首先,Cognify 将工作流视为一个优化对象,并将所有可能的 Cog 视为其超参数 (hyperparameter)。Cognify 为工作流超参数设计了一套新的贝叶斯优化器(Bayesian Optimizer),用于调优这些工作流超参数。特制的优化器能够有效探索 cog 组合空间。其次,Cognify 将 cog 分为两层:外循环包含更改工作流结构的 cog(例如添加或移除组件或重新排列它们的顺序),内循环包含不影响工作流结构的 cog(例如提示词调优和模型选择)。这种双层方法减少了贝叶斯优化器需要探索的整体搜索空间。
CogHub:AI 工作流优化器集合
与 Cognify 同时推出的是 CogHub——一个开源 cog 集合。就像 HuggingFace 集合了开源的模型,CogHub 集合了开源的 AI 工作流优化方法。CogHub 在被 Cognify 内部调用的同时也面向程序员或未来的生成式 AI 工具。
CogHub 现支持以下五种 cogs:
- 任务分解 (Task Decomposition)(外循环):将一个任务(一次 LLM 调用)分解为多个细分的子任务(多次 LLM 调用)。
- 任务集成 (Task Ensemble)(外循环):构建并结合多个模块来完成任务。
- 多步推理 (Multi-step Reasoning)(内循环):要求 LLM 逐步推理。
- 少样本学习 (Few-shot Learning)(内循环):从输入样本中添加一些高质量的示例演示。
- 模型选择 (Model SelectioN)(内循环):评估不同的模型。
优化案例
以下是一个数据可视化任务的例子。任务目标是由手机销售数据生成针对每个厂商每个季度的销量的箱型图,并计算每个手机商的销售平均值,最终用平均值线表示。
下图展示了几个生成图的对比, 1) 人工画的基准图,2) 直接询问 OpenAI o1,3) 直接运行 MatPlotAgent 工作流,4) DSPy 优化过的工作流,以及 5) 由 Cognify 优化过的工作流。Cognify 优化过的工作流返回的结果几乎与基准图吻合,质量显著优于其他方案。与此同时,Cognify 优化过的工作流的运行成本仅有 o1-preview 的 4%。
图 A:人工画的基准
图 B:GPT o1-preview 的生成图
图 C:原生成式 AI 工作流的生成图
图 D:DSPy 优化过的生成式 AI 工作流生成图
图 E:Cognify 优化过的生成式 AI 工作流生成图
GenseeAI 简介
GenseeAI(gensee.ai)是由 UCSD 张怡颖教授带领的初创公司。GenseeAI 致力于生成式 AI 工作流优化、部署、推理和基础平台创建,目前已在多家世界 500 强公司推广初期产品。张怡颖教授师从图领奖得主 David Patterson 学门,是计算机系统领域的国际顶尖专家,获得业界和学术界多项大奖和广泛认可。GenseeAI 的其他核心团队来自于美国谷歌和 Snap 等高科技公司,具有开发和运营日活跃用户上亿级别的 AI 产品的经验。
相关推荐
- 义乌推广营销公司seo,霸屏推广多少?
-
推广营销公司SEO是指通过优化网站内容、结构和关键词,提高网站在搜索引擎中的排名,以吸引更多的潜在客户和流量,从而实现营销目标。...
- 搜索效果差,试试这几个办法
-
搜索质量差,找不到所需内容时,可以尝试以下几种方法:换搜索工具;优化关键词;使用搜索指令;多看一些结果。1、换搜索工具搜索效果差,那就换个搜索工具,看看其它搜索引擎的结果。...
- 铲除网站死链接详细操作指南
-
死链接会危机网站的安全,死链接的存在意味着网站存在毛病。首先要认识HTTP状态码含义:不能访问的链接称为死链接。当我们访问我们网站页面的时候,它会返回一个三位数的信号给我们的浏览器。比如我打电话给你,...
- 想要网站快速地被收录,你试过这些方法了没?
-
做网站优化的,都有一个共同的梦想那就是想要网站可以快速地被搜索引擎收录,而且收录量还要大。然而现实总是残酷的,在现在这搜索引擎算法中不使用作弊的手法情况下,想要网站达到秒收录绝不是网上那些随便说的一些...
- 百度收录URL无标题泛目录站群系统
-
尽量使用满年备案米或者历史备案米,白板备案米需要强引蜘蛛,历史米可以保留主站直接开目录本地先操作(服务器操作也是可以)1:本地先配置关键字,其它不用管,一行一个。2:data/url这个文件夹设置自己...
- 网站快速收录工具大公开!用对方法流量轻松翻倍
-
大家都知道,搜索引擎可是网站流量的关键入口。要是网站的URL不能及时被收录,哪怕内容再好,也很难获得满意的曝光量。不过别担心,147seo新推出了一款超实用的URL批量推送收录工具,而且它支持...
- 利用专题页打造关键词排名绿色通道
-
很多朋友在做SEO的时候,经常会遇到大量长尾词没有排名,针对性的做了大量的工作,但是作用不大,关键词仍旧难以上来,非常纠结。今天悟道SEO跟大家分享一下利用专题页面,为你的大量长尾关键词开通排名绿色通...
- 如何解决关键词排名急剧下降的方法
-
1、搜索引擎自身的原因搜索引擎的算法时常都会有细微的改变,这样或多或少的会影响到网站排名,这种情况有的时候过几天就恢复了,有的一直不会恢复。解决办法:对于这种原因,你先要分析下原因,并且到大型的seo...
- 网站关键词排名:网站排名上不去怎么办?
-
多数企业都知道,网站优化很重要,网站关键词排名也是。咱们都希望站点收录更多更快,但是很多企业网站建成后,只被收录,排名却上不去,一点流量都没有。而且网站关键词排名老是出现较大波动,时高时低,让人琢磨不...
- 郑州企业网站关键词排名最专业的公司
-
网站的关键词排名在当今时代,却受到了人们更高的关注率。因为网站的关键词排名,会直接影响到网站曝光率、点击率和访问量,尤其是企业网站,会直接决定该企业网站的潜在意向客户资源的积累量。现在上网的人几乎都...
- 关键词如何快速排名
-
关键词如何快速排名关键词排名是指在搜索引擎中,某个关键词对应的网页在搜索结果中的位置。在互联网时代,关键词排名对于网站的流量和曝光度至关重要。然而,随着搜索引擎算法的不断升级和优化,关键词排名变得越来...
- 网站关键词排名会被哪些操作影响?
-
相信各位做网站优化的朋友们都知道一件事是,内容为王,很多朋友为了达到这一目的,埋头苦干,但是还是没有排名,这是为什么呢?网站关键词排名会被哪些操作影响?那么,接下来小编就跟大家分享下影响网站关键词...
- 核心关键词排名一夜消失?未被惩罚的网站如何应对幽灵降权!
-
深夜的流量监控面板上,原本稳定的核心关键词排名突然集体下滑。没有警告邮件,GoogleSearchConsole后台也没有任何人工处罚记录——这正是让众多网站管理者困惑的"幽灵更新"...
- SEO关键词优化全攻略,从选词到排名的实战技巧
-
做SEO的小伙伴们肯定都有个头疼的问题:到底怎么优化关键词才最有效呢?别急,当你弄清楚目标关键词和长尾关键词的区别,学会挖掘长尾词之后,就该正式开启关键词优化之旅啦!...
- SE排名与Moz:找到正确的搜索引擎优化工具,用于2025
-
厌倦了搜索引擎优化工具,没有真正帮助你发展?如你计划2025年的战略,找到正确的平台,可以改变一切。两个名字你可能遇到:SE排名与Moz.两者都提供的功能等级跟踪关键的研究,并建立链接,但他们适...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- 网站建设 (107)
- 网站开发 (47)
- 网络推广哪个平台好 (47)
- 百度收录 (50)
- 搜索引擎排名优化 (49)
- 关键词优化工具 (51)
- 外贸网站建设 (56)
- seo整站优化吧 (50)
- 广州seo (47)
- 苏州网站建设 (59)
- 百度搜索推广 (61)
- 关键词优化公司 (51)
- 广州网站建设 (48)
- 电商网站建设 (49)
- 百度站长平台 (48)
- 网站模板 (51)
- 厦门网站建设 (52)
- 百度快照推广 (51)
- 免费网页在线客服系统 (53)
- 雷神代刷网站推广 (53)
- 手机网站建设 (53)
- 网站维护 (53)
- 网页制作教程 (66)
- 百度收录批量查询工具 (48)
- 网站服务器 (53)