“高考作文看似是考试,但其实是对价值观、人生观和家国意识的引导。高考是本质是思政任务,反映了国家意志”。
ai算法的精准预测
每年高考各科的题目都会成为一度火爆的话题,在高考前夕无数人会对高考题目做一番猜想及预测。
哔哩哔哩的一位up主“图灵的猫”在今年5月31日发布了利用人工智能算法预测今年高考的语文作文题的视频,截至到目前,视频中全对国各地高考卷作文预测命中率达到了7中4。
up主“图灵的猫”对高考作文的预测之一
上图预测中,精准地押中了全国乙卷的高考作文题干中“奥运”、“拼搏”等关键要素。
2022年全国乙卷 高考作文题目
高考作文命题的预测方法
在感叹预测结果精准之余,值得去了解、探究一下预测的过程。
预测高考作文题的先决条件是理解它的本质,“图灵的猫”做了大量调研、思考,最后形成总结。
“高考作文看似是考试,但其实是对价值观、人生观和家国意识的引导。高考是本质是思政任务,反映了国家意志”。
“图灵的猫”编写了爬虫,爬取了互联网上的开放数据,将国家意志的体现载体锁定于重要报告、人民日报和央视新闻等内容。将其中的数据进行清洗,剔除低质量、低关联的内容,利用人工智能算法,加入预训练模型后进行主题建模,最后形成了近一年国家意志的宏观方向即“高考作文的题目预测”。
预测工作流
互联网开放数据的真正价值
人工智能算法是up主“图灵的猫”完成对整个高考作文命题的预测的手段,它的技术门槛是相对较高的。
换一种角度看待这次的预测,从“原材料”角度出发,它证明了互联网开放数据的价值。“图灵的猫”所爬取的重要报告、人民日报和央视新闻都是互联网上可以找到的开放内容(我们对此统称为互联网开放数据),加以算法后完成了预测。
在工业大数据深耕数年的宝贵经验也引导着中云数据走向互联网开放数据这条赛道,利用互联网开放数据赋能工业数字化转型。
中云数据核心理念
中云数据将互联网上所有关于工业的行业、地域、企业、产品、人才、政策、技术的开放数据进行采集。
互联网上的各类数据格式不一、纷繁复杂,利用中云数据自研的底层工业大数据平台rtod(real-time on demand)进行“同化”,可通俗地理解为“变成了相同的格式”。
随后将它们中具有关联性的进行串联,编织成了一张网—— 工业机理图谱(ilexigraph)。
工业机理图谱在不断扩充、累加,最后形成了工业数据共生空间,该数据空间对互联网上所有的工业开放数据分门别类,包含七大维度——行业、地域、企业、产品、人才、政策和技术。
从底层平台到上层应用,在工业数据共生空间、工业大数据平台等基础设施的支撑下,大大降低了中云数据产品的研发难度,提高了整体业务流转的效率,应运而生了面向工业的首款垂直搜索引擎——工业快搜 iqsearch。
为了满足产业的个性化需求,中云数据在同步研发面向新能汽车领域的工业聚焦互联网 focused3w。
无论是现实世界还是网络世界,“存在即合理”,任何资源对人类来说都是有着它存在的重大意义,它们一直都在那儿,但如何好好利用,为人类自身创造更大的价值是亘古不变的话题。
互联网是人类最大的数据库,中云数据在深耕互联网中的开放数据时永远保持着思考,以学徒的心不断努力前行,只为了那份“赋能工业数字化转型”的真挚情怀与愿望。