「TOCFL 學習者語料庫」所收集的語料是母語非華語的外籍人士參加華語文能力測驗(TOCFL)所寫的作文。 寫作時間為2006到2012年。共收集4567篇,約150萬字。如欲進一步參考語料庫建置內容請參考專書論文「TOCFL作文語料庫的建置與應用」。其中2837篇(989045字)經過偏誤標記處理,即收在這個公開網站上的檢索內容。關於偏誤標記的說明解釋,請參考專書論文「TOCFL學習者語料庫的偏誤標記」。
「華語語料驅動教學法教師培訓工作坊」於2021年10月首次開設,課程為期一個月,共12個小時,培養超過 70 位在職華語教師。這些在職教師在課程中學習了語料庫語言學的基本知識,也認識現有的華語語料庫(主要是國家教育研究院開發的COCT語料庫),並透過實際操作、作業練習的方式,學習檢索語料、分析、篩選語料、設計DDL課程活動等。