ISPiiK

為中央研究院語言學研究所曾淑娟研究員執行台灣華語語音開源資料收集計畫所建置的線上錄音工具。

本計畫已通過中央研究院人文社會科學倫理委員會研究計畫審查(申請案編號:AS-IRB-HS 02-24057-N)。

用於錄製各年齡層台灣華語使用者的語音資料,以進行聲學分析及建立自動語音評估模型。

為進行語音聽感評估、聲學分析研究及建立自動語音清晰度、正確性評估模型,
需收集涵蓋各年齡層台灣華語使用者的語音資料及進行後續相應的語言學人工標註。

本線上開源資料收集計畫使用中央研究院語言學研究所開發之語音收集APP:
「愛說話ISPiiK」,以建立可供社會大眾使用之各年齡層單詞與連續語音資料庫。

該應用程式需要麥克風存取,使用者根據示範音檔錄下圖卡所顯示的字詞,
不受任何時、地、物影響,只要進入應用程式即可進行錄音,以記錄最自然的發音。

本應用程式如何存取、蒐集、使用及分享使用者資料(隱私權政策)

環節 說明
1. 存取權限 App 僅向裝置請求 麥克風權限 以錄製語音,無相機、通訊錄、定位或其他敏感權限。
2. 蒐集資料項目
  • 語音錄音檔(單詞/句子)。
  • 基本背景:年齡、性別、母語種類、是否有說話困難或障礙(可拒答)。
  • 系統產生:錄音流水號、時間戳、裝置平台(Android/iOS)。
  • 未成年參與者:監護人姓名、身分證字號、電話(僅用於驗證同意,計畫結束即銷毀)。
3. 蒐集方式 使用者於「線上同意書」頁面點擊同意並填寫背景資料後開始錄音;可隨時退出 App 中止。
4. 資料使用目的
  • 語音聽感標註與聲學分析。
  • 訓練/評估自動化語音清晰度、正確性模型。
  • 語言學研究、教學與社會應用。
5. 資料分享與公開
  • 錄音與對應背景欄位以 CC0 授權全量開放。
  • 資料集中不含可識別個人隱私資訊(姓名、聯絡方式、定位等)。
6. 資料保存與安全
  • 錄音檔與背景資料即時上傳至後端資料庫,僅計畫主持人可存取。
  • 監護人個資於研究結束後刪除;其餘開放資料永久保存並公開。
  • 資料庫採權限管控,僅限授權研究人員存取。
7. 使用者權利
  • 使用者可自由參與,並可於錄音途中隨時關閉 App 終止。
  • 若欲撤回資料,請聯絡主持人並提供身分佐證;因資料已去識別,計畫方不保證可精準刪除。
  • 如有疑慮,可聯繫中央研究院研究對象保護諮詢專線(02-2787-2669)。

點擊查看計畫審查PDF

使用者條款、資訊安全與隱私權政策

計畫主持人:曾淑娟

信箱:tsengsc@gate.sinica.edu.tw

電話:02-26525014