2 展望
在未来的发展中,该项目将持续发挥其巨大的应用价值。首先,通过微调大语言模型(LLM),特别是垂类的LLM,将提高学生问题的回答准确性和质量。这将有助于学生更好地理解和掌握知识,提高教育的效果。
其次,将项目部署到云端服务器,将有助于推广和扩展系统的覆盖范围使更多用户无需复杂的安装和配置过程,轻松访问系统。这将有助于普及高质量教育资源,减轻学校和教师的负担,提高教育的可及性
此外,项目计划扩展到其他学科,使更多领域受益于自适应教育系统的优势。这将为不同学科的学生提供更多学习选择和支持。
最后,引入知识图谱技术,将有助于提高系统的智能化程度,从而更好地辅助教师的出题和提供高质量的答疑服务。这不仅有助于提高教育的质量,还有助于满足学生和教师的需求推动教育领域的创新和改进。通过这些发展,该项目将在实际教育中产生更加明显的应用价值,为教育领域的创新与进步贡献重要力量。
6 参考文献
[1]Nan Pu, Wei Chen, Yu Liu, Erwin M. Bakker, Michael S. LewLifelong Person Re-Identification via Adaptive Knowledge Accumulation, DOI:
https://doi.org/10.48550/arXiv.2103.12462
[2]Abien Fred Agarap. Deep learning using rectified linear units(relu). arXiv preprint arXiv:1803.08375, 2018. 4
[3]Qingming Leng, Mang Ye, and Qi Tian. A survey of openworld person re-identification. IEEE Trans. Circuit Syst. Video Technol., 30(4):1092–1108, 2019. 1
[5]Rosemary A Cowell, Morgan D Barense, and Patricnow S Sadil. A roadmap for understanding memory: Decomposing cognitive processes into operations and representations. Eneuro, 6(4), 2019. 1, 3, 5
[6]Justin Gilmer, Samuel S Schoenholz, Patrick F Riley, Oriol Vinyals, and George E Dahl. Neural message passing for quantum chemistry. arXiv preprint arXiv:1704.01212, 2017. 4
[7]Douglas Gray and Hai Tao. Viewpoint invariant pedestrian recognition with an ensemble of localized features. In ECCV, pages 262–275, 2008. 6
[8]Alexander Hermans, Lucas Beyer, and Bastian Leibe. In defense of the triplet loss for person re-identification. arXiv preprint arXiv:1703.07737, 2017. 6
[9]Martin Hirzer, Csaba Beleznai, Peter M Roth, and Horst Bischof. Person re-identification by descriptive and discriminative classification. In scandinavian conference on image analysis, pages 91–102. Springer, 2011. 6
[10]Timothy Hospedales, Antreas Antoniou, Paul Micaelli, and Amos Storkey. Meta-learning in neural networks: A survey. arXiv preprint arXiv:2004.05439, 2020. 5
[11]Xin Jin, Cuiling Lan, Wenjun Zeng, Zhibo Chen, and Li Zhang. Style normalization and restitution for generalizable person re-identification. In CVPR, pages 3143–3152, 2020. 1
[12]Thomas N Kipf and Max Welling. Semi-supervised classi- fication with graph convolutional networks. In ICLR, 2017. 4
[13]James Kirkpatrick, Razvan Pascanu, Neil Rabinowitz, Joel Veness, Guillaume Desjardins, Andrei A Rusu, Kieran Milan, John Quan, Tiago Ramalho, Agnieszka GrabskaBarwinska, et al. Overcoming catastrophic forgetting in neural networks. Proceedings of the national academy of sciences, 114(13):3521–3526, 2017. 5
[14]Alex Krizhevsky, Geoffrey Hinton, et al. Learning multiple layers of features from tiny images. Technical report, University of Toronto, 2009. 1, 2
[15]Yann LeCun, L´eon Bottou, Yoshua Bengio, and Patrick Haffner. Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11):2278–2324, 1998. 2
[16]Francisco M Castro, Manuel J Mar´ın-Jim´enez, Nicol´as Guil, Cordelia Schmid, and Karteek Alahari. End-to-end incremental learning. In ECCV, pages 233–248, 2018. 2
[17]Wei Li and Xiaogang Wang. Locally aligned feature transforms across views. In CVPR, pages 3594–3601, 2013. 6
[18]吴南中.自适应学习模型的构建及其实现策略[J].现代教育技术, 2017, 27(9):7.DOI:10.3969/j.issn.1009-8097.2017.09.002.
[19]姜强,赵蔚,王朋娇,等.基于大数据的个性化自适应在线学习分析模型及实现[J].中国电化教育, 2015(1):8.DOI:10.3969/j.issn.1006-9860.2015.01.014.
[20]姜强,赵蔚.面向“服务”视角的自适应学习系统设计与实现[J].中国电化教育, 2011.DOI:CNKI:SUN:ZDJY.0.2011-02-027.
1 设计方案 1.1需求分析 人工智能正迅速催生教育领域的革命性创新。AI教育体系的建设是为了贯彻国家实施的《新中国教育现代化2035》以及《高等学校人工智能创新行动计代人工智能发展规划》等政策,旨在构建多层次的人工智能教育系统。当前,这一领域正在迎来高速发展的时期。 当前我国教育发展面临着一系列突出的问题,这些问题显现出明显的矛盾。首先,城乡和地区之间的教育资源分配极不均衡,导致一些地区的学生面临着教育资源匮乏的困境。同时,学生之间的个体差异巨大,教师的水平参差不齐,教学内容和方法缺乏足够的针对性,难以满足不同学生的需求,这进一步削弱了教育的质量。此外,教育体制中存在一些问题,例如,教师不得不承担批改作业等低价值、重复性的工作,这使他们分身乏力,难以专注于提升教学效果本身。特别是在一些教育贫困地区,学校常常面临师资短缺和师生比例过低等问题,这导致教育质量大幅下降。师生比过低的情况下,教师难以为每位学生提供个性化、精准的指导,进一步损害了教育的质量。在激烈竞争和内卷化日益严重的教育环境中,许多学生不得不求助于课外辅导班,以填补正式教育的不足。 但是自2015年开始,我国政府出台了一系列政策,旨在减轻学生的课业负担,并严格查处课外辅导班。这些政策不断推进,2021年的双减政策更是明确规定了对校外培训的严格监管和规范。今年,双减政策满两周年之际,全国校外教育培训监管与服务综合平台正式上线,进一步加强了对校外培训机构的管理。8月13日教育部还颁发了《校外培训行政处罚暂行办法》,规定从今年10月15日起,全国范围内将禁止任何形式的补课活动。 尽管政策的出台,学生和教师仍然急需高质量的教育。在这个背景下,本文提出的大语言自适应教育系统具备巨大的应用潜力。对于学生而言,这一系统具备自动调整教学内容和方法的能力,以满足每位学生的个性化需求,从而提高教学质量,且内置的自适应算法会检测学生的学习状态,以求达到最佳学习状态而不会出现焦虑,无聊等负面情绪。而对于老师端,本系统提供了学生关系,试题管理,大模型辅助备课等功能,帮助老师减负且增强教学水平。 据调查,在2022人工智能教育蓝皮书调查,在走访超过1400家学校后,如图1.3可知,大部分学校的信息化硬件设备总体情况较好,并配备了一定数量的智能设备,但是AI教育应用的相关软件系统还较为欠缺。也就是说,学校信息化智能系统建设仍处于“重硬轻软”阶段。而在教育应用的软件系统中,自适应学习系统是热门方向。 此外,该系统还能够弥补教育资源分配不均的问题,使得教育贫困地区的学生也能享受到优质学校的资源。最重要的是,它可以帮助学生在政策禁止课外辅导班的情况下仍然获得高质量的教育,满足了国家政策的要求。因此,这个教育系统在当前教育背景下不仅具有重要的意义,还拥有广泛的应用前景,有望为解决我国教育领域的种种难题提供一种创新性的解决方案。 根据我们的调查结果,如图1.2所示,国内的两款系统主要用于学生的课后练习和辅导。例如,猿题库是一款智能在线题库系统,其主要目的是为学生提供个性化的练习机会。而乂学则更像是一种课后辅导工具,它对知识点进行了极为精细的分类,并为每个知识点提供了相应的教学内容。相比之下,国外的两款系统更侧重于整个课程的学习。 总结来说,我们可以归纳出以下教育领域的痛点: 1.许多学校的自适应学习系统仍然停留在传统的离线机房上机学习模式,未能跟上现代教育技术的发展。 2.学生和教师之间的互动不足,学校依然采用传统的试题布置方式,学生仍然需要完成大量纸质作业,导致学习体验与现代技术脱节。 3.很多自适应系统局限于学生的课后练习和辅导,未能充分考虑各个学生的个人差异和外部因素,无法提供真正的个性化学习体验。 4.学生在学习过程中常常无法随时解答疑问、获取学习资料或获得实时提示和帮助,导致学习的效率和质量受到限制。这也限制了学习的互动性和反馈性,使得学生的学习经验受到限制。 这些痛点表明了教育领域亚需创新和改进,以满足学生和教师日益增长的需求,使教育更加个性化、互动化和高效。自适应教育系统的发展和应用有望为解决这些问题提供新的途径和解决方案。 1.3 设计目标和商业市场 本研究的设计目标旨在开发一个综合性的自适应学习系统,系统整合了大语言模型(Pangu alpha)、LanChain,自适应模型,Xpath,Django框架以及MySQL数据库等技术,以实现以下关键目标: 1.对于学生,在双减政策下,课外辅导班的关闭使得我们的自适应学习系统拥有广大市场,我们希望它亦可以代替课外辅导班,实现学生学习,使用大模型模拟老师对学生疑问进行解答,为学生提供最佳学习路径,学习资料等功能,系统中的自适应模型也能为学生减负,实现学习和减负双赢的局面。 2.对于学校,根据以上调查,学校还有巨大的市场空间普及自适应学习系统,可以和学校合作,拥有很好的前景。 3.对于教师,我们系统拥有方便的教师教学管理,方便教师监管和大模型辅助的功能,为教师备课教学提供帮助。 4.我们系统顺应国家《新一代人工智能发展规划》、《中国教育现代化2035》和《高等学校人工智能创新行动计划》等政策倡议,致力于推动教育领域的变革和创新,提供全面解决方案。 针对1.2中所述行业痛点我们制定了我们的项目目标是:自适应学习技术的核心是通过个性化学习帮助老师和学生实现更好的学习效果。设计了如下解决方案: 1.切实部署落地,使用由Django开发在线学习平台。 2.不放弃传统老师布置练习模式,并使用LLM盘古大模型辅助老师出题和备课。 3.结合多篇论文,从学生的能力,情感,心理,外部因素,学习效果等多达20多个方面自定义学生模型。 4.使用LLM辅助学生随时解答疑问,提供资料,学习路径等。并爬取收集清理了多本高中官方教材和超11万道优质试题,采用LangChain辅助大模型生成更有效,更高精度的回答。
2 实现方案 2.1 项目设计流程图及实验环境 我们从网上使用Xpath爬虫技术爬取了超11万道优质试题和大量官方教材等资料,在经过清洗处理后存储在华为obs-browser-plus云obs桶中,再在ModelArts平台上获取数据,使用平台上的Ascend910 NPU算力,使用LangChain经过chunk,embending后获得faiss知识库,在学生进行提问时进行查找生成多个高精度Quary,并输入Ltm多轮提示词工程,最后形成最佳prompt,使用MindSpore框架下的MindFormers套件中的Trainer高阶接口,可以方便的对模型进行部署和推理,将输入到Pangu alpha大模型对问题进行回答,并输出到Djiango框架前端展示。 2.2 系统功能流程图 使用Django作为项目的Web框架,实现在线考试系统。设置了管理员,教师,学生三种角色,方便学校-教师-学生三方配合管理。三种人员的功能模块如下图2.2所示。 2.2.1 自适应模型设计 经过阅读大量论文,自定义了一个自适应学生模型。模型设计图如下图2.3所示,我们将学生模型分为学生学习过程种的自适应模型,用于动态控制学生在学习过程中的适应程度,并以此来使学生在学习中达到最佳学习状态。和情感学习风格模型用于体现学生的学习风格,学习情感心理等因素,并以此来制定最适合学生的学习路线。 2.2.2 自适应模型设计 自适应度模型用于动态控制学习过程中试题的难度系数,确保学生学习状态位于最佳。我们需要确保学生在学习过程中的自适应值在压力边界1.2与意义边界0.8之间,才能确保学习过程中学生处于最佳学习状态。 自适应度值C=学习压力Y/学习能力X 学习压力Y与学习能力X的计算公式如下: 2.2.3 学习风格模型 其中学习风格模型基于Felder -Silverman 向量表,如表1.1所示,考虑了学生的学习风格,学习能力,心理,情感等超过20种因素,用于控制学习过程中试题的知识点的出题顺序,确保知识点的学习吻合学生的学习风格。旨在为学生提高最适合本人的学习路线。 2.2.3 LLM+LangChain辅助学习 采用盘古大模型+LangChain的方式,可以实现基于本地知识库的高质量的问答。使用Xpath爬虫技术从网上爬取超11万道优质试题和多本官方教材,在对数据进行清洗处理后,使用ModelArts平台的Ascend910 NPU算力,使用LangChain进行chunk,embeding成faiss向量库,在学生进行提问时进行查找生成多个高精度Quary,并输入Ltm多轮提示词工程,最后形成最佳prompt输入到Pangu alpha大模型,对问题进行回答,并输出到前端展示。
3 实验数据与结果 3.1 项目代码链接 本文使用MindSpore框架进行构建,为MindSpore社区贡献项目。代码开源链接:https://github.com/aZhenzzz/LLM_Adaptive-study-system.git 3.2 实验结果展示 邀请了多位高中学生参与测试,90%以上的同学都给出了好评。提取了有一位同学后台数据,如图3.2所示,可以发现该同学的自适应值一直在1,即最佳附近徘徊,未出现焦虑和无聊的情况,从正确率图也可以看出,该同学的答题正确率在逐步提高。 4 特色创新 该项目使用MindSpore框架下的Pangu alpha大语言模型、ModelArts平台与Ascend910 NPU算力的实现,并自定义自适应教育算法模型等。此外,项目利用Xpath爬虫技术,收集并处理了大量的教材和试题数据,为系统提供了丰富的资源。使用了LangChain处理外挂向量库,可以使得大模型进行更专业的回答。以下是这个系统的一些创新点: