这是一个基于深度学习和多模态大模型的智能题目提取系统,能够从各种格式的文档(PDF、PPT、DOC、PNG)中自动识别、提取和结构化题目内容。系统采用YOLO目标检测模型进行文档布局分析,结合视觉语言模型(VLM)和大型语言模型(LLM)实现高精度的题目识别和结构 ...