基于文本叙事的心理健康水平与韧性预测系统 | Yixin Zhu

项目背景与目标

随着自然语言处理（NLP）与心理健康研究的融合，利用个体 narrative（叙事写作）文本预测心理健康水平（如抑郁、焦虑、应激）及心理韧性，成为 AI+心理领域的前沿课题。Narrative 文本包含丰富的情感、认知和行为线索，能够为心理状态评估提供创新视角。本项目以儿童青少年及成人的 narrative 文本为基础，实现多维心理健康量表分数的自动预测，探索文本特征与心理表征的深层关联。

系统核心目标：输入 narrative 文本，输出抑郁、焦虑、应激、心理韧性等量表分数，支持风险分级与可解释性展示。学生需掌握文本特征挖掘、深度模型建模、多任务预测与 NLP 系统集成等关键技术。

核心任务设计

任务一：系统架构设计与流程规范（25分）

设计完整预测系统流程，包括数据预处理、文本建模、特征抽取、模型预测、可解释性分析等模块。
明确输入/输出格式，梳理各模块间数据流与职责。
推荐采用模块化（如 FastAPI 后端 + Streamlit 前端）架构，便于扩展与维护。
- FastAPI：基于标准 Python 类型提示、自动生成 OpenAPI 文档与交互式 API 文档（/docs、/redoc），支持高性能异步，适合服务化部署。
- Streamlit：纯 Python 快速搭建交互界面，支持数据可视化与模型推理展示；可在本地或通过 Community Cloud/Snowflake 快速部署。
绘制系统结构图与流程图，简要说明各技术实现方案。

任务二：narrative 文本特征工程与深度建模（30分）

挖掘 narrative 文本中的多层次心理相关特征：
- 传统特征：词汇量、情感极性、主题分布、心理词典（如 LIWC）计数等。
- 语义特征：BERT/ERNIE 等预训练模型句向量、重点句抽取、事件序列信息等。
- 高级特征：认知重评、归因风格、社交线索、时间感等。
支持特征可视化与组间差异分析（如不同健康风险等级下指标对比）。
可酌情结合音频等多模态数据辅助提升表现。

任务三：心理健康与韧性多任务预测模型（30分）

构建多任务学习框架，同时预测多个心理量表分数（如 PHQ-9、GAD-7、PSS、CD-RISC 等）。
支持分数回归与风险分级分类两种模式。
尝试多种模型（如 LightGBM、Transformer、RoBERTa 等），分析性能差异。
实现模型可解释性分析（如 SHAP/LIME），揭示重要文本片段或特征对预测的影响。

任务四：系统集成与用户体验（15分）

开发交互式界面，支持 narrative 文本输入、量表选择、预测结果展示与解释说明。
支持批量与单条预测，自动区分儿童/成人等人群。
展示预测分数、风险等级及高亮关键文本片段。
支持一键重新预测、结果导出。
推荐前端用 Streamlit，后端 API 用 FastAPI，保证响应时间 < 30 秒、系统稳定。

数据集与技术栈

核心数据：儿童青少年与成人 narrative 文本及其心理量表数据（如 PHQ-9、GAD-7、PSS、CD-RISC 等）。可结合公开心理健康 NLP 数据集、心理词典（如 LIWC）。
推荐依赖：Python 3.9+，transformers、scikit-learn、pandas、shap、fastapi、streamlit、matplotlib 等。主流 NLP 模型如 BERT/RoBERTa/ERNIE（支持 GPU）。

评估标准与预期成果

预期交付物

完整系统代码（GitHub 仓库）
系统架构与方法技术文档、特征分析与可视化报告
5–10 条典型案例预测结果（含文本、量表分数、风险解释）
10 分钟系统演示视频

参考文献

Pennebaker, J. W., Boyd, R. L., Jordan, K., & Blackburn, K. (2015). The development and psychometric properties of LIWC2015.
Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. arXiv:1810.04805.
Ribeiro, M. T., Singh, S., & Guestrin, C. (2016). “Why should I trust you?”: Explaining the predictions of any classifier. KDD.
Ramirez, S. (2018). FastAPI framework, high performance, easy to learn, fast to code, ready for production. https://fastapi.tiangolo.com/
Streamlit Inc. (2019). Streamlit — A faster way to build and share data apps. https://streamlit.io/