基于文本叙事的心理健康水平与韧性预测系统

项目背景与目标

随着自然语言处理(NLP)与心理健康研究的融合,利用个体 narrative(叙事写作)文本预测心理健康水平(如抑郁、焦虑、应激)及心理韧性,成为 AI+心理领域的前沿课题。Narrative 文本包含丰富的情感、认知和行为线索,能够为心理状态评估提供创新视角。本项目以儿童青少年及成人的 narrative 文本为基础,实现多维心理健康量表分数的自动预测,探索文本特征与心理表征的深层关联。

系统核心目标:输入 narrative 文本,输出抑郁、焦虑、应激、心理韧性等量表分数,支持风险分级与可解释性展示。学生需掌握文本特征挖掘、深度模型建模、多任务预测与 NLP 系统集成等关键技术。

核心任务设计

任务一:系统架构设计与流程规范(25分)

  • 设计完整预测系统流程,包括数据预处理、文本建模、特征抽取、模型预测、可解释性分析等模块。
  • 明确输入/输出格式,梳理各模块间数据流与职责。
  • 推荐采用模块化(如 FastAPI 后端 + Streamlit 前端)架构,便于扩展与维护。
    • FastAPI:基于标准 Python 类型提示、自动生成 OpenAPI 文档与交互式 API 文档(/docs、/redoc),支持高性能异步,适合服务化部署。
    • Streamlit:纯 Python 快速搭建交互界面,支持数据可视化与模型推理展示;可在本地或通过 Community Cloud/Snowflake 快速部署。
  • 绘制系统结构图与流程图,简要说明各技术实现方案。

任务二:narrative 文本特征工程与深度建模(30分)

  • 挖掘 narrative 文本中的多层次心理相关特征:
    • 传统特征:词汇量、情感极性、主题分布、心理词典(如 LIWC)计数等。
    • 语义特征:BERT/ERNIE 等预训练模型句向量、重点句抽取、事件序列信息等。
    • 高级特征:认知重评、归因风格、社交线索、时间感等。
  • 支持特征可视化与组间差异分析(如不同健康风险等级下指标对比)。
  • 可酌情结合音频等多模态数据辅助提升表现。

任务三:心理健康与韧性多任务预测模型(30分)

  • 构建多任务学习框架,同时预测多个心理量表分数(如 PHQ-9、GAD-7、PSS、CD-RISC 等)。
  • 支持分数回归与风险分级分类两种模式。
  • 尝试多种模型(如 LightGBM、Transformer、RoBERTa 等),分析性能差异。
  • 实现模型可解释性分析(如 SHAP/LIME),揭示重要文本片段或特征对预测的影响。

任务四:系统集成与用户体验(15分)

  • 开发交互式界面,支持 narrative 文本输入、量表选择、预测结果展示与解释说明。
  • 支持批量与单条预测,自动区分儿童/成人等人群。
  • 展示预测分数、风险等级及高亮关键文本片段。
  • 支持一键重新预测、结果导出。
  • 推荐前端用 Streamlit,后端 API 用 FastAPI,保证响应时间 < 30 秒、系统稳定。

数据集与技术栈

  • 核心数据:儿童青少年与成人 narrative 文本及其心理量表数据(如 PHQ-9、GAD-7、PSS、CD-RISC 等)。可结合公开心理健康 NLP 数据集、心理词典(如 LIWC)。
  • 推荐依赖:Python 3.9+,transformers、scikit-learn、pandas、shap、fastapi、streamlit、matplotlib 等。主流 NLP 模型如 BERT/RoBERTa/ERNIE(支持 GPU)。

评估标准与预期成果

预期交付物

  • 完整系统代码(GitHub 仓库)
  • 系统架构与方法技术文档、特征分析与可视化报告
  • 5–10 条典型案例预测结果(含文本、量表分数、风险解释)
  • 10 分钟系统演示视频

参考文献

  • Pennebaker, J. W., Boyd, R. L., Jordan, K., & Blackburn, K. (2015). The development and psychometric properties of LIWC2015.
  • Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. arXiv:1810.04805.
  • Ribeiro, M. T., Singh, S., & Guestrin, C. (2016). “Why should I trust you?”: Explaining the predictions of any classifier. KDD.
  • Ramirez, S. (2018). FastAPI framework, high performance, easy to learn, fast to code, ready for production. https://fastapi.tiangolo.com/
  • Streamlit Inc. (2019). Streamlit — A faster way to build and share data apps. https://streamlit.io/
Previous
Next