考拉閱讀獲3000萬 Pre-A輪融資,要用中文閱讀分級(jí)系統(tǒng)為孩子匹配最適合書籍
【獵云網(wǎng)北京】8月14日?qǐng)?bào)道(文/徐刪刪)
近日,獵云網(wǎng)曾報(bào)道過的考拉閱讀向獵云網(wǎng)透露,他們于近日完成3000萬Pre-A輪融資,清科基金領(lǐng)投,真格基金和伽利略資本增持。據(jù)悉,此輪融資將主要用于底層人工智能技術(shù)的進(jìn)一步深耕以及產(chǎn)品的升級(jí)上。
寫進(jìn)國(guó)家戰(zhàn)略的“閱讀”目標(biāo)
“個(gè)體閱讀能力的差異與海量難度不一的圖書之間鏈接的斷層,讓孩子讀什么、怎么讀的問題始終困擾著家長(zhǎng)和老師。”CEO趙梓淳說。
在國(guó)外,文本閱讀分級(jí)的思想和產(chǎn)品已形成成熟的體系,分級(jí)閱讀已覆蓋了美國(guó)90%的學(xué)校。主流的分級(jí)系統(tǒng)藍(lán)思分級(jí)和GE分級(jí)測(cè)評(píng)體系的科學(xué)性和效率都已經(jīng)得到了市場(chǎng)的認(rèn)可,許多科技公司也應(yīng)運(yùn)而生,包括通過分級(jí)閱讀和數(shù)據(jù)分析,創(chuàng)建適于每個(gè)學(xué)生閱讀能力的個(gè)人圖書館的產(chǎn)品,Lightsail和將新聞聚合并分級(jí),為不同閱讀水平的學(xué)生提供時(shí)事新聞的產(chǎn)品,Newsela等。
在國(guó)內(nèi),目前,國(guó)家政策已經(jīng)確立了關(guān)于國(guó)家語言文字事業(yè)十三五規(guī)劃,同時(shí)“閱讀”一項(xiàng)重要的教育素質(zhì),也已被劃入義務(wù)教育的階段性目標(biāo)中。語文教學(xué)被放在了越來越重要的地位上。
但是,由于實(shí)施義務(wù)教育階段課程標(biāo)準(zhǔn)無與之匹配的閱讀體系與評(píng)價(jià)體系,校園分級(jí)圖書不能滿足學(xué)生個(gè)體的閱讀需求,使得閱讀在教育領(lǐng)域的推廣始終面臨著巨大的挑戰(zhàn)。同時(shí),缺乏合理的閱讀訓(xùn)練方式和閱讀推薦也導(dǎo)致中國(guó)兒童閱讀興趣難以調(diào)動(dòng),結(jié)構(gòu)不均,成長(zhǎng)性不足的問題。如何解決這些問題,是擺在整個(gè)教育事業(yè)面前的巨大挑戰(zhàn)。
適于中文語言的分級(jí)標(biāo)準(zhǔn)
“我們希望打造的是最適合中國(guó)人的閱讀分級(jí)標(biāo)準(zhǔn)。”CEO趙梓淳說。
考拉閱讀是以享閱中文分級(jí)標(biāo)準(zhǔn)(ER Framework)為依托、針對(duì)于K12的分級(jí)閱讀產(chǎn)品,可以根據(jù)學(xué)生的閱讀能力推薦適合的讀物,并提供全方面的閱讀數(shù)據(jù)監(jiān)控與分析。
考拉閱讀團(tuán)隊(duì)的成員
由于打造中文分級(jí)標(biāo)準(zhǔn)和自適應(yīng)學(xué)習(xí)系統(tǒng)的存在很大難度,因此,在創(chuàng)建中國(guó)本土化的閱讀分級(jí)體系的時(shí)候,享閱教育組建了一支 “高學(xué)歷+經(jīng)驗(yàn)”的核心技術(shù)團(tuán)隊(duì):享閱教育的CTO任易是北京大學(xué)數(shù)據(jù)挖掘方向的博士,曾在IBM中國(guó)研發(fā)中心Waston for Life Service和搜狐大數(shù)據(jù)中心工作;首席科學(xué)家Jake Zhao曾在Facebook從事研究工作,師從于機(jī)器學(xué)習(xí)頂尖學(xué)者、深度學(xué)習(xí)的奠基人之一Yann LeCun教授;CPO蘇雋琪則畢業(yè)于斯坦福大學(xué),曾經(jīng)是美國(guó)Google 總部search infrastructure team的產(chǎn)品經(jīng)理;首席語言學(xué)家李軒則為香港中文大學(xué)的語言學(xué)博士。
此外,享閱教育還打造了一只由頂尖語文教研員和語言學(xué)家,心理學(xué)家組成的教研團(tuán)隊(duì)。目前,已經(jīng)與北京大學(xué)機(jī)器學(xué)習(xí)實(shí)驗(yàn)室和紐約大學(xué)Courant研究院CILVRLab實(shí)驗(yàn)室進(jìn)行了合作,共同研發(fā)ER Framework(享閱中文分級(jí)標(biāo)準(zhǔn))。
據(jù)了解,目前,在團(tuán)隊(duì)的努力下,享閱教育已構(gòu)建起屬于自己的中文分級(jí)標(biāo)準(zhǔn)的基本框架。在中文領(lǐng)域,將相關(guān)語言學(xué)知識(shí)通過數(shù)字化AI 系統(tǒng)進(jìn)行擬合。按照中文語言各單位層級(jí)的構(gòu)成規(guī)律,提取出了語義邏輯,嵌套深度、信息熵等十幾個(gè)特征作為模型分級(jí)的基本思路架構(gòu),對(duì)文本進(jìn)行多維度的信息提取。
CEO趙梓淳介紹,以“詞”這個(gè)大的維度為例,具體細(xì)分為詞類、構(gòu)造(詞的組合能力)、透明度(詞義可從構(gòu)成要素的意義上推知的難易度,從透明到隱晦,難度逐漸增加)和抽象性(與詞義的具體化相對(duì)應(yīng))四重特征。
為孩子匹配最適合的書籍
“從閱讀材料和讀者能力兩個(gè)方面對(duì)數(shù)據(jù)進(jìn)行測(cè)評(píng),可以更加精確的結(jié)合孩子真實(shí)的閱讀能力,為其匹配最合適的書籍,也能在可控的分?jǐn)?shù)范圍內(nèi),挑戰(zhàn)孩子的閱讀能力。”
考拉閱讀獲得OTEC海外學(xué)人創(chuàng)業(yè)大賽國(guó)內(nèi)組第一名
考拉閱讀把讀者的閱讀能力和文本難度劃分到同一標(biāo)準(zhǔn)范圍之內(nèi),二者范圍都在200ER—1300ER之間。測(cè)量結(jié)果涵蓋兩個(gè)方面,一是對(duì)閱讀材料難度的劃分;二是對(duì)讀者本身能力的評(píng)估,目前,效度和信度經(jīng)過大量的實(shí)證性研究已經(jīng)比較理想。
產(chǎn)品從ER文本分級(jí)和ER 能力分級(jí)兩個(gè)兩項(xiàng)分別切入。在閱讀材料的評(píng)級(jí)上,通過對(duì)文本進(jìn)行各維度的信息提取,將文字以數(shù)字化的形式呈現(xiàn),進(jìn)而通過數(shù)據(jù)挖掘,將文本進(jìn)行難度分類或聚類;在語言學(xué)和教育學(xué)的專家進(jìn)行過人工評(píng)審的基礎(chǔ)上,借由深度學(xué)習(xí)算法,進(jìn)一步精確數(shù)據(jù)匹配的精確程度。
在對(duì)讀者本身能力的評(píng)估的打造上,每一篇閱讀材料之后都會(huì)附有閱讀理解的小測(cè)試,孩子們能夠通過完成測(cè)試題目,自主檢測(cè)自己對(duì)該級(jí)別難度文章的理解程度,從而測(cè)算出孩子真正的閱讀水平。在此基礎(chǔ)上,孩子可以更精準(zhǔn)的搜尋到真正匹配自己閱讀能力的文本。
走進(jìn)學(xué)校
“家長(zhǎng)和老師,很多時(shí)候有兩個(gè)疑惑,一是到底給孩子讀什么書;二是孩子閱讀的完成程度到底如何。”CEO趙梓淳說。
基于享閱中文分級(jí)系統(tǒng)(ER Framework),考拉閱讀打造了面向校園的分級(jí)閱讀產(chǎn)品。該平臺(tái)分為學(xué)生端、教師端和校長(zhǎng)端。學(xué)生在使用的時(shí)候,可以在平臺(tái)上進(jìn)行閱讀能力自測(cè),在可控分?jǐn)?shù)內(nèi)進(jìn)行閱讀能力的提升訓(xùn)練;對(duì)于教師而言,可以通過平臺(tái)發(fā)布閱讀任務(wù)并跟蹤學(xué)生閱讀進(jìn)度;同時(shí)平臺(tái)還為校長(zhǎng)提供校級(jí)閱讀數(shù)據(jù)報(bào)告與學(xué)習(xí)情況管理的便利。
考拉閱讀教師端中文分級(jí)閱讀能力測(cè)評(píng)報(bào)告頁面
據(jù)了解,考拉閱讀目前目前已經(jīng)與兩百余所小學(xué)建立了合作關(guān)系,在短期內(nèi),考拉閱讀計(jì)劃走進(jìn)更多的學(xué)校,覆蓋一到三線的10個(gè)合作示范區(qū)市,600多所試點(diǎn)學(xué)校,讓更多的孩子能夠體驗(yàn)到閱讀分級(jí)系統(tǒng)和產(chǎn)品對(duì)語文學(xué)習(xí)的助力。
同時(shí),考拉閱讀已初步建立起面向?qū)W生的閱讀書籍庫(kù),收錄及分級(jí)的書本數(shù)量達(dá)10000+,但是現(xiàn)階段仍只支持線下閱讀,在線閱讀的功能目前正在開展大型的出版社合作,在未來進(jìn)一步打通。