关于2025年安徽省大数据与人工智能应用竞赛校内选拔赛通知
一、大赛主题
人工智能,大数据
二、参赛对象
在校在读全日制大学生、研究生。技能赛为个人参赛,作品赛可以个人参赛,也可组队参赛。组队参赛时,人数不超过 3 人(含)。
三、竞赛内容
(一)竞赛内容
本次竞赛设两个赛道:
1.大数据赛道
2.人工智能赛道
(二)竞赛内容
1.大数据赛道
本赛道分为“本科软件组”和“创意组”。
(1)本科软件组竞赛内容
大数据预处理:参赛选手根据题目要求对给定的数据(数据可能不完整、不一致、重复、含噪音等)进行预处理,使得数据准确、完整、一致、可用,并能够对数据格式进行转换以及完成初步统计任务。MR
大数据分析:参赛选手根据题目要求在已搭建好的大数据平台上进行数据的分析。Hive
综合应用:对给定的数据集,参赛选手综合应用大数据预处理、大数据分析与挖掘等技术,求解一个给定的问题。 Spark
(2)创意组竞赛分为四个主题:
主题1:教育领域大数据及人工智能应用
基于教育领域大数据,实现特定教育场景下的任务,对教育场景具有较好的实际应用价值和意义。 可以参照的思考维度包括并不限于(鼓励学生提出自己的思考维度): 1. 教学过程数据分析 2. 智能助教机器人 3. 教育资源建设 4. 智慧课堂管理 5. 教育管理的决策支持等。
主题2:医疗保健行业大数据及人工智能应用
基于医疗领域大数据,采用大数据和人工智能技术实现特定医疗保健行业中的任务,对医疗领域具有较好的实际应用价值和意义。
主题3:大模型相关应用
结合大模型的智能问答算法作品赛。此赛道以大模型为基础,可选择性结合自然语言处理、信息检索、知识图谱和机器学习等技术,以提供更智能、准确和人性化的答案。
主题4:其他行业大数据及人工智能应用
面向特定行业领域中的实际应用问题,基于行业数据及人工智能技术,探索应用场景并自行获取相关数据,最终提交具有原创性并能够进行可视化应用展示的参赛作品。
内容要求参赛作品须围绕大数据与人工智能核心技术,探索有具体落地场景的技术应用创意方案,如大数据与人工智能技术在工业、农业、医疗、文化、教育、金融、交通、公共安全、日常生活、公益等行业领域的应用探索。
竞赛采用开放命题,参赛作品须使用大数据与人工智能相关技术。参赛者应充分发挥创新能力,自由探索应用场景并自行获取相关数据,最终提交具有原创性并能够进行可视化应用展示的参赛作品。
2.人工智能赛道
本赛道分为“本科软件组”和“硬件组”。
(1)本科软件组竞赛内容
传统机器学习算法设计及应用:典型传统机器学习算法的设计应用。包含但不限于逻辑回归、支持向量机、决策树、Kmeans等,根据题目或场景,通过选用机器学习算法利用Sklearn或者其它机器学习框架训练模型,实现分类、聚类算法并解决问题。
深度学习算法设计及应用:包括但不限于卷积神经网络、循环神经网络、对抗生成网络、强化学习算法等。根据题目或场景,通过选用深度学习相关算法,实现如图像、语音、文本分析等结构化/非结构化数据的识别检测等。
人工智能技术综合应用:给定现实场景和数据集,综合运用人工智能相关技术解决给定问题。
(2)硬件组竞赛内容
大模型提示词的设计:对给定的任务,考生自行设计大模型的提示词prompt模板。实现大模型的对话并能按照指定格式输出、生成包含指定物体的图片、传入图片、输出指定的描述信息等。
大模型微调的实现:加载给定的数据集,并对数据集进行预处理,利用代码或训练工具读取大模型,并对处理好的数据集进行微调训练。(包含:增量预训练、指令监督微调、奖励模型训练、PPO训练、DPO训练、KTO训练、ORPO等)
大模型的综合分析:总结分析能力,文档写作能力。能够从算力资源、训练推理、准确率等多方面对大模型任务的开发流程进行科学分析和构思,形成一整套可行的计划方案。
四、参赛报名
加入校赛QQ群498235256,群内在线填写报名表,报名截止日期2025年9月10日23:55。根据校赛成绩,择优推荐省赛。学生加群时请备注“年级专业+姓名”。
教务处
计算机科学与技术学院
用户登录