aZhenzz/AdaptiveStudy：自适应历史科目学习测试助手

1 设计方案 1.1需求分析人工智能正迅速催生教育领域的革命性创新。AI教育体系的建设是为了贯彻国家实施的《新中国教育现代化2035》以及《高等学校人工智能创新行动计代人工智能发展规划》等政策，旨在构建多层次的人工智能教育系统。当前，这一领域正在迎来高速发展的时期。当前我国教育发展面临着一系列突出的问题，这些问题显现出明显的矛盾。首先，城乡和地区之间的教育资源分配极不均衡，导致一些地区的学生面临着教育资源匮乏的困境。同时，学生之间的个体差异巨大，教师的水平参差不齐，教学内容和方法缺乏足够的针对性，难以满足不同学生的需求，这进一步削弱了教育的质量。此外，教育体制中存在一些问题，例如，教师不得不承担批改作业等低价值、重复性的工作，这使他们分身乏力，难以专注于提升教学效果本身。特别是在一些教育贫困地区，学校常常面临师资短缺和师生比例过低等问题，这导致教育质量大幅下降。师生比过低的情况下，教师难以为每位学生提供个性化、精准的指导，进一步损害了教育的质量。在激烈竞争和内卷化日益严重的教育环境中，许多学生不得不求助于课外辅导班，以填补正式教育的不足。但是自2015年开始，我国政府出台了一系列政策，旨在减轻学生的课业负担，并严格查处课外辅导班。这些政策不断推进，2021年的双减政策更是明确规定了对校外培训的严格监管和规范。今年，双减政策满两周年之际，全国校外教育培训监管与服务综合平台正式上线，进一步加强了对校外培训机构的管理。8月13日教育部还颁发了《校外培训行政处罚暂行办法》，规定从今年10月15日起，全国范围内将禁止任何形式的补课活动。尽管政策的出台，学生和教师仍然急需高质量的教育。在这个背景下，本文提出的大语言自适应教育系统具备巨大的应用潜力。对于学生而言，这一系统具备自动调整教学内容和方法的能力，以满足每位学生的个性化需求，从而提高教学质量，且内置的自适应算法会检测学生的学习状态，以求达到最佳学习状态而不会出现焦虑，无聊等负面情绪。而对于老师端，本系统提供了学生关系，试题管理，大模型辅助备课等功能，帮助老师减负且增强教学水平。据调查，在2022人工智能教育蓝皮书调查，在走访超过1400家学校后，如图1.3可知，大部分学校的信息化硬件设备总体情况较好，并配备了一定数量的智能设备，但是AI教育应用的相关软件系统还较为欠缺。也就是说，学校信息化智能系统建设仍处于“重硬轻软”阶段。而在教育应用的软件系统中，自适应学习系统是热门方向。此外，该系统还能够弥补教育资源分配不均的问题，使得教育贫困地区的学生也能享受到优质学校的资源。最重要的是，它可以帮助学生在政策禁止课外辅导班的情况下仍然获得高质量的教育，满足了国家政策的要求。因此，这个教育系统在当前教育背景下不仅具有重要的意义，还拥有广泛的应用前景，有望为解决我国教育领域的种种难题提供一种创新性的解决方案。根据我们的调查结果，如图1.2所示，国内的两款系统主要用于学生的课后练习和辅导。例如，猿题库是一款智能在线题库系统，其主要目的是为学生提供个性化的练习机会。而乂学则更像是一种课后辅导工具，它对知识点进行了极为精细的分类，并为每个知识点提供了相应的教学内容。相比之下，国外的两款系统更侧重于整个课程的学习。总结来说，我们可以归纳出以下教育领域的痛点: 1.许多学校的自适应学习系统仍然停留在传统的离线机房上机学习模式，未能跟上现代教育技术的发展。 2.学生和教师之间的互动不足，学校依然采用传统的试题布置方式，学生仍然需要完成大量纸质作业，导致学习体验与现代技术脱节。 3.很多自适应系统局限于学生的课后练习和辅导，未能充分考虑各个学生的个人差异和外部因素，无法提供真正的个性化学习体验。 4.学生在学习过程中常常无法随时解答疑问、获取学习资料或获得实时提示和帮助，导致学习的效率和质量受到限制。这也限制了学习的互动性和反馈性，使得学生的学习经验受到限制。这些痛点表明了教育领域亚需创新和改进，以满足学生和教师日益增长的需求，使教育更加个性化、互动化和高效。自适应教育系统的发展和应用有望为解决这些问题提供新的途径和解决方案。 1.3 设计目标和商业市场本研究的设计目标旨在开发一个综合性的自适应学习系统，系统整合了大语言模型（Pangu alpha）、LanChain,自适应模型，Xpath,Django框架以及MySQL数据库等技术，以实现以下关键目标： 1.对于学生，在双减政策下，课外辅导班的关闭使得我们的自适应学习系统拥有广大市场，我们希望它亦可以代替课外辅导班，实现学生学习，使用大模型模拟老师对学生疑问进行解答，为学生提供最佳学习路径，学习资料等功能，系统中的自适应模型也能为学生减负，实现学习和减负双赢的局面。 2.对于学校，根据以上调查，学校还有巨大的市场空间普及自适应学习系统，可以和学校合作，拥有很好的前景。 3.对于教师，我们系统拥有方便的教师教学管理，方便教师监管和大模型辅助的功能，为教师备课教学提供帮助。 4.我们系统顺应国家《新一代人工智能发展规划》、《中国教育现代化2035》和《高等学校人工智能创新行动计划》等政策倡议，致力于推动教育领域的变革和创新，提供全面解决方案。针对1.2中所述行业痛点我们制定了我们的项目目标是：自适应学习技术的核心是通过个性化学习帮助老师和学生实现更好的学习效果。设计了如下解决方案： 1.切实部署落地，使用由Django开发在线学习平台。 2.不放弃传统老师布置练习模式，并使用LLM盘古大模型辅助老师出题和备课。 3.结合多篇论文，从学生的能力，情感，心理，外部因素，学习效果等多达20多个方面自定义学生模型。 4.使用LLM辅助学生随时解答疑问，提供资料，学习路径等。并爬取收集清理了多本高中官方教材和超11万道优质试题，采用LangChain辅助大模型生成更有效，更高精度的回答。

2 实现方案 2.1 项目设计流程图及实验环境我们从网上使用Xpath爬虫技术爬取了超11万道优质试题和大量官方教材等资料，在经过清洗处理后存储在华为obs-browser-plus云obs桶中，再在ModelArts平台上获取数据，使用平台上的Ascend910 NPU算力，使用LangChain经过chunk,embending后获得faiss知识库，在学生进行提问时进行查找生成多个高精度Quary，并输入Ltm多轮提示词工程，最后形成最佳prompt，使用MindSpore框架下的MindFormers套件中的Trainer高阶接口，可以方便的对模型进行部署和推理，将输入到Pangu alpha大模型对问题进行回答，并输出到Djiango框架前端展示。 2.2 系统功能流程图使用Django作为项目的Web框架，实现在线考试系统。设置了管理员，教师，学生三种角色，方便学校-教师-学生三方配合管理。三种人员的功能模块如下图2.2所示。 2.2.1 自适应模型设计经过阅读大量论文，自定义了一个自适应学生模型。模型设计图如下图2.3所示，我们将学生模型分为学生学习过程种的自适应模型，用于动态控制学生在学习过程中的适应程度，并以此来使学生在学习中达到最佳学习状态。和情感学习风格模型用于体现学生的学习风格，学习情感心理等因素，并以此来制定最适合学生的学习路线。 2.2.2 自适应模型设计自适应度模型用于动态控制学习过程中试题的难度系数，确保学生学习状态位于最佳。我们需要确保学生在学习过程中的自适应值在压力边界1.2与意义边界0.8之间，才能确保学习过程中学生处于最佳学习状态。自适应度值C=学习压力Y/学习能力X 学习压力Y与学习能力X的计算公式如下： 2.2.3 学习风格模型其中学习风格模型基于Felder -Silverman 向量表，如表1.1所示，考虑了学生的学习风格，学习能力，心理，情感等超过20种因素，用于控制学习过程中试题的知识点的出题顺序，确保知识点的学习吻合学生的学习风格。旨在为学生提高最适合本人的学习路线。 2.2.3 LLM+LangChain辅助学习采用盘古大模型+LangChain的方式，可以实现基于本地知识库的高质量的问答。使用Xpath爬虫技术从网上爬取超11万道优质试题和多本官方教材，在对数据进行清洗处理后，使用ModelArts平台的Ascend910 NPU算力，使用LangChain进行chunk,embeding成faiss向量库，在学生进行提问时进行查找生成多个高精度Quary，并输入Ltm多轮提示词工程，最后形成最佳prompt输入到Pangu alpha大模型，对问题进行回答，并输出到前端展示。

3 实验数据与结果 3.1 项目代码链接本文使用MindSpore框架进行构建，为MindSpore社区贡献项目。代码开源链接：https://github.com/aZhenzzz/LLM_Adaptive-study-system.git 3.2 实验结果展示邀请了多位高中学生参与测试，90%以上的同学都给出了好评。提取了有一位同学后台数据，如图3.2所示，可以发现该同学的自适应值一直在1，即最佳附近徘徊，未出现焦虑和无聊的情况，从正确率图也可以看出，该同学的答题正确率在逐步提高。 4 特色创新该项目使用MindSpore框架下的Pangu alpha大语言模型、ModelArts平台与Ascend910 NPU算力的实现，并自定义自适应教育算法模型等。此外，项目利用Xpath爬虫技术，收集并处理了大量的教材和试题数据，为系统提供了丰富的资源。使用了LangChain处理外挂向量库，可以使得大模型进行更专业的回答。以下是这个系统的一些创新点：

大语言模型应用：该系统引入了盘古大语言模型，将其用于题目的生成、学生问题的解答，一键分析错题，学习建议等待。这是教育领域中的一项创新，利用自然语言处理技术提供更智能化的学习和考试支持。
自适应题目推荐：通过阅读大量论文，采用自定义的学生模型，从学生学习过程和情感两方面入手，考虑超过20多项内部外部因素，能够智能地推荐适合他们水平和需求的考试题目，从而个性化学习体验。这种自适应性是传统教育系统所不具备的创新。
教师辅助题目生成与备课辅助：教师可以借助大语言模型生成考试题目，不仅节省了时间，还能够创建更具挑战性和多样性的题目，鼓励学生思考和创造。还可以进行备课辅助等，为老师减负。
LLM+LangChain：使用LangChain处理数据形成向量库，辅助大模型形成更精确更专业的知识回答，实现基于本地知识库的问答，使得大模型能如同个人定制的AI教师般，可以为学生答疑解惑，提供学习辅助。
多角色用户系统：系统提供学生、教师和管理员不同角色的用户系统，为不同用户提供了定制化的功能和体验，增强了系统的灵活性和适用性。
综合性教育支持：系统不仅提供考试相关的功能，还支持学生的问题解答和学习建议，以全面提高教育质量和学生的学习效果。
技术与教育融合：系统将最新的自然语言处理技术与教育领域相结合，为教育带来了技术创新，推动了教育的智能化和个性化。这些创新点使得这个系统成为教育领域的一项重要贡献，为学生、教师和教育机构提供了更好的教育工具和资源，有助于提高教育的质量和效率。 5 总结与展望
1 总结这个自适应考试辅助系统的设计与实现代表了教育领域的一项重大创新，为学生、教师和教育机构带来了广泛的意义和益处。首先，该系统为学生提供了更为灵活和个性化的学习体验。通过利用大语言模型，系统能够为学生推荐定制的考试题目，并提供详细的解析和问答支持，从而帮助他们更好地理解知识，提高学习效率。这不仅有助于学生在考试中取得更好的成绩，还培养了他们的自主学习能力和问题解决能力。其次，教师受益于系统提供的高效工具，可以更轻松地管理考试科目和题目，同时借助大语言模型的辅助，可以生成更具挑战性和多样性的题目，促进学生的深度思考和创造性思维。这有助于提高教育质量，推动教育机构不断提升教学水平。此外，管理员通过系统可以更方便地跟踪学生成绩和教师工资情况，优化教育资源的分配和管理，提高教育机构的运营效率。总之，这个自适应考试辅助系统不仅提供了先进的技术支持，还为教育领域带来了以下重大意义：
个性化学习：促进了学生的个性化学习，满足了不同学生的需求，提高了学习效果。
教育质量提升：通过多样性的题目和高效的教学工具，提高了教育质量，培养了学生的综合能力。
教学资源优化：帮助教育机构更好地管理资源，提高了运营效率。
技术创新：代表了教育领域的技术创新，为未来教育发展提供了有力的支持。综上所述，这个系统的意义不仅在于提高了考试和学习的效率，更在于为教育领域带来了发展机会，推动了教育向更加智能化、个性化和高质量的方向迈进。
2 展望在未来的发展中，该项目将持续发挥其巨大的应用价值。首先，通过微调大语言模型(LLM)，特别是垂类的LLM，将提高学生问题的回答准确性和质量。这将有助于学生更好地理解和掌握知识，提高教育的效果。其次，将项目部署到云端服务器，将有助于推广和扩展系统的覆盖范围使更多用户无需复杂的安装和配置过程，轻松访问系统。这将有助于普及高质量教育资源，减轻学校和教师的负担，提高教育的可及性此外，项目计划扩展到其他学科，使更多领域受益于自适应教育系统的优势。这将为不同学科的学生提供更多学习选择和支持。最后，引入知识图谱技术，将有助于提高系统的智能化程度，从而更好地辅助教师的出题和提供高质量的答疑服务。这不仅有助于提高教育的质量，还有助于满足学生和教师的需求推动教育领域的创新和改进。通过这些发展，该项目将在实际教育中产生更加明显的应用价值，为教育领域的创新与进步贡献重要力量。 6 参考文献 [1]Nan Pu, Wei Chen, Yu Liu, Erwin M. Bakker, Michael S. LewLifelong Person Re-Identification via Adaptive Knowledge Accumulation, DOI: https://doi.org/10.48550/arXiv.2103.12462 [2]Abien Fred Agarap. Deep learning using rectified linear units(relu). arXiv preprint arXiv:1803.08375, 2018. 4 [3]Qingming Leng, Mang Ye, and Qi Tian. A survey of openworld person re-identification. IEEE Trans. Circuit Syst. Video Technol., 30(4):1092–1108, 2019. 1 [5]Rosemary A Cowell, Morgan D Barense, and Patricnow S Sadil. A roadmap for understanding memory: Decomposing cognitive processes into operations and representations. Eneuro, 6(4), 2019. 1, 3, 5 [6]Justin Gilmer, Samuel S Schoenholz, Patrick F Riley, Oriol Vinyals, and George E Dahl. Neural message passing for quantum chemistry. arXiv preprint arXiv:1704.01212, 2017. 4 [7]Douglas Gray and Hai Tao. Viewpoint invariant pedestrian recognition with an ensemble of localized features. In ECCV, pages 262–275, 2008. 6 [8]Alexander Hermans, Lucas Beyer, and Bastian Leibe. In defense of the triplet loss for person re-identification. arXiv preprint arXiv:1703.07737, 2017. 6 [9]Martin Hirzer, Csaba Beleznai, Peter M Roth, and Horst Bischof. Person re-identification by descriptive and discriminative classification. In scandinavian conference on image analysis, pages 91–102. Springer, 2011. 6 [10]Timothy Hospedales, Antreas Antoniou, Paul Micaelli, and Amos Storkey. Meta-learning in neural networks: A survey. arXiv preprint arXiv:2004.05439, 2020. 5 [11]Xin Jin, Cuiling Lan, Wenjun Zeng, Zhibo Chen, and Li Zhang. Style normalization and restitution for generalizable person re-identification. In CVPR, pages 3143–3152, 2020. 1 [12]Thomas N Kipf and Max Welling. Semi-supervised classi- fication with graph convolutional networks. In ICLR, 2017. 4 [13]James Kirkpatrick, Razvan Pascanu, Neil Rabinowitz, Joel Veness, Guillaume Desjardins, Andrei A Rusu, Kieran Milan, John Quan, Tiago Ramalho, Agnieszka GrabskaBarwinska, et al. Overcoming catastrophic forgetting in neural networks. Proceedings of the national academy of sciences, 114(13):3521–3526, 2017. 5 [14]Alex Krizhevsky, Geoffrey Hinton, et al. Learning multiple layers of features from tiny images. Technical report, University of Toronto, 2009. 1, 2 [15]Yann LeCun, L´eon Bottou, Yoshua Bengio, and Patrick Haffner. Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11):2278–2324, 1998. 2 [16]Francisco M Castro, Manuel J Mar´ın-Jim´enez, Nicol´as Guil, Cordelia Schmid, and Karteek Alahari. End-to-end incremental learning. In ECCV, pages 233–248, 2018. 2 [17]Wei Li and Xiaogang Wang. Locally aligned feature transforms across views. In CVPR, pages 3594–3601, 2013. 6 [18]吴南中.自适应学习模型的构建及其实现策略[J].现代教育技术, 2017, 27(9):7.DOI:10.3969/j.issn.1009-8097.2017.09.002. [19]姜强,赵蔚,王朋娇,等.基于大数据的个性化自适应在线学习分析模型及实现[J].中国电化教育, 2015(1):8.DOI:10.3969/j.issn.1006-9860.2015.01.014. [20]姜强,赵蔚.面向“服务”视角的自适应学习系统设计与实现[J].中国电化教育, 2011.DOI:CNKI:SUN:ZDJY.0.2011-02-027.