Agent
Agent
Agent定义
在人工智能领域,“Agent”一词有着多重含义,常常导致行业内讨论时需要不断澄清其具体指代。最初,Agent的理论根源可以追溯到20世纪50年代,强化学习中的Agent被定义为一个能够与环境交互、具备明确目标、能从经验中学习并主动探索新行动的实体,强调的是“探索与利用(Exploration vs. Exploitation)”的平衡。然而,随着大语言模型(LLM)的兴起,业界和投资圈对Agent的理解发生了转变。如今,Agent更多指的是基于LLM构建的、能够自主完成复杂任务的智能系统。这种新型Agent注重在真实世界中自主决策和执行复杂任务,强调“自主性”和“实用性”。虽然有观点希望Agent能像强化学习中的Agent那样具备“自主进化”能力,但两者的概念基础和侧重点实际上并不相同。
目前,业界对“Agent”存在泛指与特指两种理解。泛指时,Agent等同于具备一定自主性的智能体;特指时,则往往指基于大模型、能够自主完成复杂任务的AI系统。人工智能的发展路径,也从早期的规则系统,经历了深度学习,再到如今的LLM时代。早期AI只是“工具”,被动响应指令。而Agent的出现,标志着AI开始主动规划和执行任务。
这一转变的关键节点在于2023年GPT-4的发布。GPT-4极大提升了大模型的推理、规划和多任务处理能力,使AI不仅能理解复杂指令,还能自主分解任务、调用工具并完成多步操作。AutoGPT、BabyAGI等开源项目的涌现,则进一步推动了Agent落地应用的可能性。
Codebase Search
Codebase search
前景摘要:Why Cline Doesn’t Index Your Codebase (And Why That’s a Good Thing) - Cline Blog
What This Actually Means
A concrete example: You ask Cline to add error handling to a payment processing function.
RAG-based approach:
- Searches for “payment” and “error” in vector space
- Retrieves chunks that happen to contain these terms
- Might miss the custom error handling framework your team built
- Suggests generic try-catch blocks that don’t match your patterns
Cline’s approach:
- Locates the payment processing function
- Traces its imports to find your error handling utilities
- Examines similar functions to understand your patterns
- Checks the calling functions to understand the error contract
- Suggests error handling that fits perfectly with your architecture
The difference? A connected comprehension of your codebase, not a summary-level understanding of all your files.
- Cline描述的是一个理想的、具备深度代码语义理解和分析能力的系统,还有漫长的路要走。
- RAG对于快速获取信息、理解某个特定功能或模块的局部代码,以及结合文档来学习项目,更直接、更高效。
1.向量数据库Qdrant
OpenManus
全国一卷语文
23.阅读下面的材料,根据要求写作。(60分)
他想要给孩子们唱上一段,可是心里直翻腾,开不了口。
——老舍《鼓书艺人》
假如我是一只鸟,
我也应该用嘶哑的喉咙歌唱
——艾青《我爱这土地》
我要以带血的手和你们一一拥抱,
因为一个民族已经起来
——穆旦《赞美》
以上材料引发了你怎样的联想和思考?请写一篇文章。
要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。
《湖水》
老舍说:他想要给孩子们唱上一段,可是心里直翻腾,开不了口。艾青说:假如我是一只鸟,我也应该用嘶哑的喉咙歌唱。穆旦说:我要以带血的手和你们一一拥抱,因为一个民族已经起来。三个人,三种表达,都在说同一件事——爱。可是后来的事,有些不太一样。老舍喜欢北京。那是一座旧城,胡同交错,茶馆林立,黄包车穿街走巷,小贩的吆喝声此起彼伏。他写这些,他热爱这些。他相信,生活在这里的普通人,哪怕是最底层的车夫、最沉默的茶馆掌柜、最平凡的一家人,他们的喜怒哀乐、挣扎与尊严,都值得被记住。他写《骆驼祥子》,写一个靠力气拉车的青年,曾梦想拥有一辆属于自己的黄包车。但命运三番五次将他踩在地上:被军阀抓壮丁、车被抢、所爱之人死于非命。一次次希望破碎,一次次尊严被剥夺。祥子最终放弃了所有理想,变成了一个麻木、堕落、随波逐流的“刺儿头”。老舍他懂这个人。他知道,这不仅是一个车夫的悲剧,是一整个社会对人的碾压,是“旧社会把人变成鬼”的真实写照。
可是,写出这一切的他,后来也没逃过那个更巨大的铁轮。
1966年夏天,文革开始。他被贴上“反动文人”“资产阶级代表”的标签,被剃阴阳头、戴高帽、挂黑牌、游街示众。那些他笔下心心念念的“群众”,曾经的读者,如今成了批斗会上的“造反派”。他们高喊口号、指着他的鼻子辱骂,殴打他的身体,撕碎他的稿纸。他被逼写检讨,却不知道自己到底错在哪里。
性心理学
性心理学 [英]霭理士 著 潘光旦 译注
译 序
像霭理士( Havelock Ellis)在本书第三章里所讨论到的种切, 译者是一个对于性的问题很早就感觉到兴趣的人,既感觉到兴趣, 就不能不觅取满足这种兴趣的方法;在三十年前的环境里,向父母 发同是不行的,找老师请教也是不行的,小同学们闲话,虽时常涉 及这个问题,但偶有闻见,也是支离破碎的一些,足以激发更大的 好奇心,而不足以满足正在发展中的知情两方面的欲望。
当时只有一条可以走的路,就是找书看,并且还不能冠冕堂皇地看,而必须偷看;所偷看的,不用说,十之八九是性爱的说部,而十之一二包括性爱的图画。 记得在 10 岁前后到 20 岁光景,这一 类的东西着实看得不少。性爱的说部与图画也许有些哲学、道德 以及艺术的意义,至于科学的价值,则可以说等于零。
古代性被严格限定为“礼教之下的繁衍工具”,即“生儿育女、传宗接代”,并非个人情感或欲望的自然表达。女性身体被家庭和国家双重规训,贞节牌坊、缠足等制度本质上是对女性性控制的象征。中国虽然进入新时代,儒家性道德依然根深蒂固,官本位文化下,性被当作衡量一个人“是否正派”“是否可以信任”的指标,身体自由从来都不是自己的。
中文语言极其讲究“隐晦”“含蓄”“不露声色”,文学传统中“留白”与“点到为止”是一种美学。性作为一种强烈的自然冲动,不适合“雅文化”的表达方式,因此常以“香艳”“风流”化名示人。
没有正常的引导,人“性启蒙”往往来自于零碎、不健康的盗版色情作品或小道传闻,形成一种充满误解和压抑的性观念。压抑的文化,只会制造更深的误解和焦虑”。就和最近**规定要求不能聚餐一样。
Noam Chomsky Speaks on What ChatGPT Is Really Good For
Noam Chomsky Speaks on What ChatGPT Is Really Good For
Noam Chomsky Interviewed by C.J. Polychroniou
May 3, 2023. Common Dreams.
Artificial intelligence (AI) is sweeping the world. It is transforming every walk of life and raising in the process major ethical concerns for society and the future of humanity. ChatGPT, which is dominating social media, is an AI-powered chatbot developed by OpenAI. It is a subset of machine learning and relies on what is called Large Language Models that can generate human-like responses. The potential application for such technology is indeed enormous, which is why there are already calls to regulate AI like ChatGPT.
人工智能(AI)正席卷全球。它正在改变各行各业,并在这个过程中引发社会和人类未来的重大伦理问题。主导社交媒体的 ChatGPT 是由 OpenAI 开发的 AI 聊天机器人。它是机器学习的子集,依赖于被称为大型语言模型的技术,这些模型能够生成类似人类的回复。这种技术的潜在应用非常巨大,这也是为什么已经有人呼吁监管像 ChatGPT 这样的 AI。
Can AI outsmart humans? Does it pose public threats? Indeed, can AI become an existential threat? The world’s preeminent linguist Noam Chomsky, and one of the most esteemed public intellectuals of all time, whose intellectual stature has been compared to that of Galileo, Newton, and Descartes, tackles these nagging questions in the interview that follows.
人工智能能否超越人类?它是否构成公共威胁?确实,人工智能能否成为生存威胁?世界顶尖语言学家、有史以来最受尊敬的公共知识分子之一诺姆·乔姆斯基,其学术地位堪比伽利略、牛顿和笛卡尔,在接下来的采访中解答了这些棘手的问题。
DeepSpeed
DeepSpeed
安装详情
使用 pip 是开始使用 DeepSpeed 的最快方法,这将安装最新版本的 DeepSpeed,它不与特定 PyTorch 或 CUDA 版本绑定。DeepSpeed 包含几个 C++/CUDA 扩展,我们通常称之为我们的“操作”。默认情况下,所有这些扩展/操作将在运行时使用 torch 的 JIT C++ 扩展加载器,它依赖于 ninja 来构建和动态链接它们。
1 | pip install deepspeed |
安装后,您可以使用 DeepSpeed 环境报告 (通过 ds_report
或 python -m deepspeed.env_report
) 验证您的安装并查看您的机器兼容哪些操作。我们发现此报告在调试 DeepSpeed 安装或兼容性问题时很有用。
vLLM
LLaMA-Factory
LLaMA-Factory
项目特色
- 多种模型 :LLaMA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi 等等。
- 集成方法 :(增量)预训练、指令监督微调、奖励模型训练、PPO 训练、DPO 训练 和 ORPO 训练。
- 多种精度 :32 比特全参数微调、16 比特冻结微调、16 比特 LoRA 微调 和 基于 AQLM/AWQ/GPTQ/LLM.int8 的 2/4/8 比特 QLoRA 微调。
- 先进算法 :GaLore、DoRA、LongLoRA、LLaMA Pro、LoRA+、LoftQ 和 Agent 微调。
- 实用技巧 :FlashAttention-2、Unsloth、RoPE scaling、NEFTune 和 rsLoRA。
- 实验监控 :LlamaBoard、TensorBoard、Wandb、MLflow 等等。
- 极速推理 :基于 vLLM 的 OpenAI 风格 API、浏览器界面 和 命令行接口。
数据集
预训练数据集指令微调数据集偏好数据集
部分数据集的使用需要确认,使用下述命令登录您的 Hugging Face 账户。