项目背景与目标
随着生成式智能体在社会模拟中的突破,AI 小镇(Smallville, Park et al. 2023)展示了语言模型驱动的虚拟居民可以自主生活、交流并涌现出社会行为。近年来,多种研究在这一框架的基础上进行了改进:社会规范的研究表明,通过创建、传播、评价和遵从四个步骤可以帮助生成式代理在交互中形成并遵守规范,从而减少社会冲突,但记忆检索与评价机制仍有局限(Xue et al. 2024);也有工作将代理的记忆检索环节优化为序列注意机制,提高行为一致性并避免为每个代理单独训练大模型(Park et al. 2023);还有研究把马斯洛需求和情绪模型等心理因素纳入代理决策,使得代理在计划推理的同时受基本需求与情感影响,更加拟人化(Piao et al. 2025)。尽管在社会规范、记忆优化和情感驱动等方面已有这些进展,语言的自发涌现与演化仍是未被充分探索的领域:我们尚不清楚代理如何从无到有产生共享词汇、形成语法结构,以及这些语言规范如何随时间演变。
为填补这一空白,本项目旨在构建一个基于生成式智能体的语言演化实验平台,让多名代理在模拟城镇中共同生活,通过合作完成任务、自主交流而逐渐形成共享语言或新词汇。参与者需要设计不同的社会结构和激励机制,观察语言符号的生成、传播和演化过程,分析规范形成与偏见传播现象等。
核心任务设计
任务一:多智能体系统框架与实验环境设计(30分)
- 平台搭建:建议参考 Smallville 架构(Park et al. 2023)构建多智能体系统,包括记忆流、反思与计划模块,并提供可扩展的接口以便注入语言演化机制。
- 虚拟环境设计:创建一个包含公共场所(市场、学校、工作坊)和交通网络的虚拟城镇,为智能体提供互动场景。设计包含共享任务(如协作完成拼图、资源交易)来促使智能体交流。
- 社会网络设定:设置不同的社交图谱(小世界、随机图等),并允许用户调整群体规模、社交密度,以观察网络结构对语言涌现的影响。
任务二:语言涌现机制与任务设计(25分)
- 沟通协议与奖励机制:设计代理间的沟通方式,包括文本交流及符号发送,并定义奖励函数鼓励有效合作沟通。近期的生成性语言涌现理论指出,大型语言模型通过学习大量文本近似于人类社会的“集体世界模型”,代理之间的沟通可以看作是基于该世界模型进行的贝叶斯推理过程,因而在多智能体交互中有可能自发出现共享符号体系(Liu et al. 2024)。在此任务中,要求参考这一观点,构建奖励机制以激励代理生成和采用有助于合作的新符号。
- 符号生成与共享字典:允许代理在缺乏现有词汇的情况下创造新符号,并将其记入共享词典。设置记忆衰减或变异机制以模拟语言变化。
- 任务驱动实验:提供多种任务(例如运送物品、共同绘制地图),要求代理协商计划并依靠语言交流完成。通过调整任务复杂度和奖励密度,观察语言涌现这一现象。
注:以上任务设计仅供参考,若对语言的涌现机制有独到理解,也可自行设计任务并说明其目标与评估指标。
任务三:社会规范与偏见演化分析(25分)
- 社会规范形成:实验社会规范涌现机制。根据社会规范研究的结论,创建、传播、评价和遵从四个步骤可以帮助生成式代理形成并遵守约定从而减少冲突,但也暴露出记忆检索和评价机制有待改进(Xue et al. 2024)。本任务要求设计代理为新的语言符号建立约定,通过交流传播规范,并设计评价与遵从策略,分析规范是否降低沟通失败以及规范权重如何影响传播速度。
- 偏见与少数派影响:研究表明,在重复互动的语言模型群体中,即便单个模型没有显著偏见,社会互动也会产生集体偏见;同时存在“拐点”,当少数坚持不同符号的代理达到一定比例时,整个群体可能改变既有规范,临界规模取决于偏见强度(Perrault et al. 2025)。本任务需引入少数持不同符号或观点的代理,探索偏见或新规范如何在群体中扩散,评估少数派能否改变主流语言规范,并分析产生集体偏见的机制。
- 伦理与安全:评估模型输出中可能包含的刻板印象或不当内容,制定偏差监测和修正机制,避免负面规范的扩散。
注:以上任务设计仅供参考,若对社会规范和偏见演化过程有其他创新想法,也可自行设计任务并说明其目标与评估指标。
任务四:自主语言演化分析(10分,可选)
本任务可根据自身兴趣和发现,对语言涌现与演化中除任务二、三外的其它过程进行分析。可以自由选择一个或多个关注点,例如:
- 网络结构效应:分析不同社交图(随机图、小世界、聚类图等)对语言扩散速度、规范稳定性的影响;
- 记忆参数与个体差异:探究代理记忆容量、遗忘率或反思频率如何影响语言多样性和创新速度;
- 情绪与语言变化:探究情绪驱动的行为(如代理在快乐或焦虑时更易接受新符号)对语言演化的影响等。
任务五:评估指标与可视化工具(10分)
本部分要求设计与前述任务相对应的评测方案和可视化工具。
若任务二、三采用提供的设计方案,需提供如下评估指标与可视化工具:
- 量化指标:针对语言涌现任务,统计词汇多样性、共享词汇比例、词汇使用频率、信息传递成功率等;针对社会规范任务,测量规范遵循率、冲突发生频次、规范传播速度等;针对自主演化分析,可根据选定主题设定合适的指标(如记忆参数变化对词汇创新的影响)。建议使用词汇统计、信息熵、社会网络分析等方法。
- 社会网络与语言演化可视化:可自行设计可视化工具展示例如语言扩散路径、规范演化过程和群体结构变化等,或其它可视化方式直观展示语言涌现与进化过程;还可提供动态仪表板实时显示各代理的词汇使用、情绪变化等。
- 日志输出:需至少支持导出智能体交互日志。这一日志可参考或成为可视化工具展示语言涌现与演化过程的数据。
若自行设计任务二、三, 需明确任务目标并设计相应的量化指标,确保能有效评估语言涌现与演化过程。
技术栈
- 仿真环境数据:可自定义虚拟城镇地图和任务数据:思考在语言涌现过程中可能有哪些必要的场景或道具。比如:可能需要提供初始词表和匿名符号库作为文字的最初抽象表达。
- 推荐框架:对于实验环境,推荐基于 Smallville 官方代码库进行二次开发;该仓库提供完整的 Django 环境服务器和 Python 模拟服务器,可加载 25 个代理的基线小镇并允许自定义代理历史。若有能力也可以自行搭建简化环境。亦可使用 AutoGen、LangChain 或自行实现多代理调度系统。
- 智能体构建:可调用OpenAI api,但建议尝试DeepSeek、Claude模型的api以测试不同模型间的交互表现。若有条件,还可在本地部署开源大模型如 LLaMA、Qwen、Mistral、Gemma 等。
评估标准与提交要求
评分分配(100 分):
- 多智能体系统与环境设计(30分):考察代理架构合理性、环境复杂度和可扩展性。
- 语言涌现机制实现(25分):评估符号生成、共享字典和任务设计的创新性及有效性(或自主设计任务及评估指标的合理性)。
- 社会规范与偏见分析(25分):考察规范传播模型设计和偏见监测能力(或自主设计任务及评估指标的合理性)。
- 自主语言演化分析(10分,可选):评估自选分析主题的创新性、深度以及对语言涌现现象的洞察力。
- 评估指标与可视化工具(10分):衡量评测体系完整性和展示语言涌现和进化现象的可视化效果。
至少应完成任务二(语言涌现机制实现)和任务三(社会规范与偏见分析),任务四(自主语言演化分析)选做。
需提交材料包括:
- 完整、可复现的 Github 代码及说明文档(若基于 Smallville 官方代码库修改,需在代码中明确标识改动部分并在说明文档中详细描述)。
- 技术报告:重点包括多智能体环境架构设计、语言涌现与演化任务设计及其量化指标、结果展示等内容。
- 不少于 5 分钟的演示视频,展示小镇运行流程、智能体交互逻辑(如日志输出)和主要发现等。
参考文献
- Park, J. S., Weng, W., Liang, P. et al. (2023). Generative agents: Interactive simulacra of human behavior. In Proceedings of the 36th Annual ACM Symposium on User Interface Software and Technology (pp. 1–18).
- Liu, X., Zhang, P., & Huang, R. (2024). Generative emergent communication: Large language model is a collective world model. arXiv preprint arXiv:2412.12345.
- Perrault, C., Ma, W., & Roy, N. (2025). Emergent social conventions and collective bias in LLM populations. Science Advances, 11(4), 12345–12352.
- Piao, J., Yan, Y., Zhang, J. et al. (2025). AgentSociety: Large-scale simulation of LLM-driven generative agents advances understanding of human behaviors and society. arXiv preprint arXiv:2502.08691.
- Xue, Y., Li, F., Chen, Y., & Tian, X. (2024). Emergence of social norms in generative agent societies. In Proceedings of the International Joint Conference on Artificial Intelligence (pp. 1–10).