QJudge 產品執行計劃書

QJudge

下世代的數位學習體驗

AI 已經改變了學習,現在輪到測驗。

當學生用 AI 寫作業、整理筆記與解題時,正式評量不能只停留在紙本考卷與人工批改。學習跟學懂之間,需要一個更公平、可信、容易執行的檢核方式。QJudge 從真實課堂考務出發,將出題、作答、監考、批改與考後資料整理集中在同一套流程中,嘗試為 AI 時代建立下一代正式測驗平台。

QJudge 米花科技 QJudge 產品執行計劃書

目錄

一、創業動機:從真實考務現場出發

(一)、從助教現場看見評量落差

在擔任管理學院大一計算機概論助教時,我看見舊有評量方式和真實能力檢核之間的落差。

計算機概論希望檢核學生的基本程式能力,但實際評量常被迫用紙筆完成。學生在考卷上手寫程式碼,或用偏知識記憶的題目取代本來應該有的上機實作。這種方式的限制相當清楚:

  1. 很難看出學生能不能自主撰寫、執行並除錯一段程式。
  2. 不同字跡、格式與每位同學跳躍式的寫法,會讓批改速度變慢,標準也不容易一致。

AI 工具普及後,這個問題變得更明顯。當老師無法確認回家作業是否由學生獨立完成,部分課程會把作業、練習與能力檢核移回課堂,改成隨堂測驗或正式考試。原本就沉重的出題、監考、批改與登分成本,會因為考試次數增加而被放大。

這個經驗讓我意識到,正式測驗的瓶頸在於執行成本。當上機題、開放題與混合題型都需要大量前置準備與考後批改,老師即使知道更好的評量方式,也很容易被行政負擔推回選擇題與填充題。

(二)、從問題到需求:第一版 QJudge 的前身

因此,我先幫管理學院的老師做出第一版線上程式測驗平台。教師與助教可以在平台上出題、辦考試與監考;學生在線上作答;系統自動判題並整理結果。整個流程不需要學生安裝 App,也不依賴斷網處理考場管制,一開始就能在現有教室裡執行。

平台上線後,其他大學老師也希望把這套系統用在自己的課堂。其中一門約 130 人的課,原本採用紙本考卷搭配 10 到 20 題開放式問答;考試規模龐大,但助教資源有限。少數助教必須在期末處理上百份混合題型考卷的批改、成績整理與爭議處理,紙本流程很難在合理時間內完成。當需求從「程式上機」延伸到「大規模監考、開放題批改與成績整理」,原本的線上判題工具也逐步演化成完整考務系統。

QJudge 的起點,就是把這些分散在紙本、表單、人工監考與 Excel 裡的考務流程整併起來,讓老師可以在同一個平台完成出題、監考、批改、登分與資料整理。第一版產品先從真實課堂出發,再逐步從程式上機考延伸到更完整的正式線上考務平台。

二、問題洞察:考務成本限制了正式測驗升級

第一版 QJudge 來自真實課堂的助教經驗:老師想用更有效的方式檢核學生能力,卻被出題、監考、批改與登分成本卡住。AI 工具普及後,回家作業與課後練習的可信度下降,更多能力檢核會回到課堂與正式測驗;考試次數一增加,原本已經沉重的考務流程就被放大。

老師們不是不願意做調整,而是調整成本太大。現行考務流程很難支撐更頻繁、更多題型、更需要監考紀錄的正式測驗。

(一)、核心痛點:考務成本讓正式測驗難以增加

教師應該把更多資源投注在教學設計、題目品質與學生理解,但現場常被繁瑣的行政成本拉走。一場正式測驗的主要成本集中在考前準備、監考、批改、登分與爭議處理;每增加一次考試,教師與助教就要同步承擔這些工作。當學生人數增加,這些流程會先消耗老師與助教大量心力。

  • 出題與題目審核 2 hr
  • 考務支出(印製、封存、考場、監考與收發卷) 2.5 hr
  • 考後人工批改 25 hr
  • 登分、爭議處理與成績整理 1.5 hr
圖 1:一場 60 人混合題型考試的教師與助教時間分配(估算)。

以一場 60 人混合題型考試估算,全程考務人力約 31 小時。主要成本來自考前題目整理與審核、紙本印製與考場收發卷、考後人工批改、登分校對與爭議處理。這些工作都不是教學設計本身,卻會佔去大量時間。

這些行政成本累積起來,會反過來限制老師設計考試的意願。老師可能知道開放式問答、實作題更能反映學生能力,但只要想到後續批改與整理成本,就很容易退回選擇題、是非題與填充等基本題型。當考前準備、監考收發卷、人工批改與登分整理都高度依賴人力,教師與助教自然更難為每一次考試重新設計題型,也更容易沿用既有題庫或過往題型。

(二)、採用阻力:線上考試需要可信監考與自然作答體驗

老師不願意把正式考試搬到線上的原因很直接:一是怕學生作弊,二是擔心線上作答反而增加學生負擔。學生可能切換螢幕查資料、截圖題目傳給別人、用通訊軟體求助,或直接把題目丟給 ChatGPT 生成答案。只要這些行為沒有被記錄,老師就很難相信線上考試的結果。

現行常見做法大多是在考試外面再加一層限制:

  1. 使用網路限制:限制校內 IP、固定考場或指定網段,要求學生在特定地點作答。
  2. 斷開網路:用斷網或局域網環境降低查資料、通訊與外部協作的可能。
  3. 使用 Safe Exam Browser 或客製化 App:要求學生安裝指定瀏覽器或考試 App,限制切換視窗、截圖與外部程式。

這些措施可以降低部分風險,但也讓線上考試變得很難推進。教師要處理設備、網路、安裝、相容性與考場管理;學生也必須配合額外設定。當一場線上考試仍然需要大量物理限制與前置準備才能執行,老師與學校自然會傾向繼續使用紙本或傳統考場。

另一個阻力來自作答體驗。選擇題、是非題與簡答題容易搬到線上,但數學、物理、化學與工程類課程常需要寫證明、推導公式、畫圖、標註座標或補充計算過程。若線上考試介面無法支援這些作答方式,學生就要花額外時間學習輸入工具,老師也會擔心考試測到的是操作能力,而不是原本要檢核的學科能力。

如果正式測驗要搬到線上,系統必須同時處理監考可信度與作答自然度。監考端需要保存監考狀態、切換視窗或異常事件、交卷紀錄與作答資料,讓助教與教師能在考中判斷、考後回溯;學生端則要盡可能降低工具學習成本,讓不同題型都能被順暢作答。線上考試不需要承諾消滅所有作弊,但必須做到有紀錄、可追溯、可判斷,也不能讓作答工具成為新的評量障礙。

(三)、延伸價值前提:資料集中後,AI 分析才有基礎

AI 分析要產生價值,前提是資料來源可信。學生在正式測驗中留下的題目、答案、交卷紀錄、批改結果與監考事件,才是後續做班級弱點、題目品質與教學調整時最有用的資料。

若考試仍以紙本為主,這些資料會分散在試卷、答案紙、人工批改紀錄與 Excel 成績表裡。教師要使用 LLM 做考後分析,還要先掃描紙本、轉錄答案、整理題目並對齊分數。QJudge 的第一步,是在考試發生時就把題目、作答、批改、成績與監考紀錄整理成結構化資料,讓 AI 批改與考後分析建立在可信資料之上。

應用層

AI 加值能力與新型評量

AI 批改、班級分析、個人化回饋

資料層

結構化考試資料

題目、作答、批改結果、監考事件、成績

基礎層

可信考試流程(QJudge 基礎建設)

出題、作答環境、監考紀錄、批改、成績匯出

圖 2:可信考試資料支撐 AI 加值能力。

(四)、產品方向與教育想像

產品方向是先把正式測驗的基礎流程做好:教師在同一個受信任的線上環境中建立題目、執行考試、掌握監考紀錄、完成批改、匯出成績,並把題目、作答、分數與事件紀錄整理成可回溯的資料。這是後續 AI 批改、分析與新型評量的基礎建設。

在這個基礎上,系統才會延伸 AI 批改、考後分析、個人化回饋與 AI 協作型測驗。未來的考試不必只停在選擇、填充與是非題,學生也可能需要操作 AI、判斷 AI 回覆、整合資料並完成任務;這類評量必須建立在可信、可回溯的考試資料之上。

未來 AI 協作型數位考試示意圖
圖 3:AI 協作型挑戰題示意。
AI 考官一對一線上考試示意圖
圖 4:AI 考官一對一測驗示意。

三、解決方案:整合考前、考中、考後的正式線上考務平台

QJudge 把考前準備、考試進行與考後處理整併在同一個系統中,並在關鍵環節加入 AI 輔助與人工複核。系統負責整理流程、保存紀錄與降低重複工作;教師仍保留題目品質、評分標準與正式採用的最後決定權。

(一)、適用對象與場景

QJudge 主要服務需要以線上或上機形式進行的正式測驗。這類考試需要監考紀錄、混合題型作答、批改複核與成績整理;適用場景包含大學課程、系所能力檢核、機構模擬考與實作型評量。下表列出目前主要服務的對象與場景,以及暫時不在服務範圍內的情境。

表 1:QJudge 主要服務場景與排除範圍
主要服務對象與場景 目前不在服務範圍
大學課程的正式上機考、混合題型期中期末考 隨堂小考、課後練習與一般回家作業
系所、院級或中心的能力檢核與共同測驗 國家級標準化考試(如學測、指考)
機構或協會主辦的線上模擬考與能力檢定 純紙筆環境、無法提供連線與裝置的考場
實驗教育、高中端的素養與實作型評量 不需要監考紀錄與批改複核的非正式測驗

(二)、整體流程

QJudge 把考前準備、考試進行與考後處理整併為單一流程,所有題目、作答、監考事件與成績資料都在同一個系統內留存。

01

考前準備

  • 題目整理與品質檢視
  • AI 出題輔助 + 教師確認
  • 考生名單與權限管理
  • 身分認證(簽到 / Face ID)
02

考試進行

  • 受保護的線上作答環境
  • 監考事件與截圖紀錄
  • 頁簽切換、離線、全螢幕偵測
  • 助教即時監看與標記
03

考後處理

  • 自動判題(客觀題、程式題)
  • AI 批改開放題 + 人工複核
  • 成績匯出與爭議題處理
  • 題目鑑別度與班級分析
結構化資料留存

題目、作答、批改、監考事件與成績集中存放,供下一場考試、AI 加值能力與機構決策使用。

圖 5:考前、考中、考後流程示意。

(三)、考前準備

考前準備的核心,是把一份還停留在 Word、Excel 或教師腦中的考試,整理成可以正式執行、可以追蹤責任、可以穩定開考的線上測驗。這個階段不能只把題目丟到平台上,而是要確認題目品質、配分規則、考生名單、作答限制與身分確認流程都已經完成,避免考試開始後才發現題目敘述不清、權限錯誤或規則沒有同步。

因此,QJudge 在考前準備階段處理三件事:

  • 題目整理與品質檢視:教師可建立題目、設定題型與配分;AI 可協助產生題目草稿、檢查題幹、答案與評分規準,正式發布仍由教師確認。
  • 作答規則管理:集中設定考試時間、題目配分、作答限制與交卷規則。
  • 考生名單與身分認證:集中管理考生名單與考試權限;實體考場可使用到場簽到,遠端考試可使用 Face ID 或臉部識別作為身分確認流程。
QJudge 題目管理與題型設定畫面
圖 6:題目管理與題型設定。
AI 出題輔助畫面
圖 7:AI 出題輔助。
教室成員管理畫面
圖 8:教室成員管理。

(四)、考試進行

考試進行階段的重點,是讓學生能專注作答,同時讓助教與教師掌握考場狀態。學生端需要穩定、清楚、低學習成本的作答介面;監考端則需要知道誰已登入、誰正在作答、誰離線、誰出現可疑事件,以及哪些狀況需要立即介入。

因此,QJudge 在考試中同時處理「作答體驗」與「監考證據鏈」。作答流程會保留題目切換、自動儲存、交卷時間與作答狀態;監考流程則記錄離開作答環境、訊號中斷、異常登入與人工標記。這些資料會在考中協助助教判斷,也會在考後成為爭議處理與成績複核的依據。

  • 環境確認與保護:考生依規則開啟鏡頭、分享螢幕並切入全螢幕模式。
  • 多題型作答:選擇、填空、簡答、開放題與程式上機題可放在同一場考試中,並支援自動存檔、題目切換與交卷流程。
  • 事件紀錄與截圖:焦點離開、全螢幕中斷、螢幕分享異常或監考標記會被記錄,並保留必要截圖。
  • 作答狀態保存:系統保留作答進度、交卷時間、作答狀態與監考事件,供考後批改與爭議處理使用。
QJudge 學生考前環境檢查畫面
圖 9:考前環境檢查。
QJudge 學生考試儀表板畫面
圖 10:學生考試儀表板。
QJudge 學生正式作答畫面
圖 11:正式作答介面。

監考證據鏈的重點,是把可能獨立發生的作弊或異常事件留下紀錄,讓助教能在考中判斷、考後回溯。系統不只標示「有沒有異常」,也保存事件時間、學生狀態與必要證據來源。

表 2:QJudge 防作弊與監考手段
可能作弊或異常事件 系統採用方式 助教端判讀方式
離開作答環境 頁簽切換、離開作答頁、離開全螢幕、滑鼠焦點離開紀錄 事件時間、持續狀態、作答進度
外部裝置或多人登入 開考清空既有登入,限制單一裝置作答,保留異常登入紀錄 登入紀錄、作答時間、考生狀態
監考證據不足或訊號中斷 依規則要求螢幕分享、鏡頭或畫面監看,保留斷連事件 斷連時間、恢復時間、畫面證據
未到場或身分不一致 QR code 簽到、Face ID 或鏡頭確認 簽到紀錄、考生名單、登入與作答資料
離線或連線異常 離線、中斷連線、長時間未回報狀態偵測 離線標示、處理紀錄、考後判斷依據
需人工介入的可疑狀況 在線狀態、作答進度、交卷情形、事件紀錄與即時監看 單一學生監考畫面、人工標記
QJudge 助教監考畫面監視截圖
圖 12:助教端即時監考。
QJudge 助教監考事件紀錄截圖
圖 13:監考事件與證據紀錄。
QJudge 實際考場監考畫面
圖 14:實際考場監考情境。
QJudge 監考學生詳細資訊總覽
圖 15:學生狀態總覽。
QJudge 監考學生考試事件紀錄
圖 16:監考事件紀錄。
QJudge 監考學生作答報告
圖 17:學生作答報告。

(五)、考後批改、資料整理與分析

考後處理的目標,是把原本分散在試卷、批改紀錄、Excel 成績表與監考註記中的資料集中起來。系統先處理可以自動判讀的題目,再讓 AI 批改與人工複核接續處理開放題,最後整理成績、作答紀錄、監考事件與題目分析。

這些資料的用途不只是在考後產生成績。教師可以用它檢查哪些題目鑑別度不足、哪些概念是全班共同弱點、哪些學生需要補救;機構也可以用它整理考試品質、回溯爭議事件,並作為下一次出題與教學調整的依據。

  • 自動判題:客觀題與程式題可由系統先完成判讀,減少重複批改。
  • AI 批改:開放題可由 AI 根據題目、參考答案與評分規準產生建議分數與評語;正式分數仍由教師或助教確認。
  • 人工複核:正式分數仍保留教師或助教複核,避免 AI 直接取代評分責任。
  • 成績匯出與校對:批改完成後可匯出成績與作答資料,降低登分與校對成本。
  • 考後分析:整理題目得分率、常見錯誤、班級弱點與個人作答狀況,作為後續教學檢討依據。
AI 批改標準生成畫面
圖 18:AI 批改規準生成。
AI 批改執行畫面
圖 19:AI 批改結果。
QJudge 考試批改成績矩陣
圖 20:批改成績矩陣。
QJudge 考試題目分析儀表板
圖 21:題目分析儀表板。

四、產品進展:平台功能開發進度與場域驗證

目前已完成正式線上考試的主要平台功能,並在 NYCU 真實課堂中完成場域驗證。平台已服務超過 200 位考生,籌辦 10 次正式或課程測驗,並驗證系統可支援百人以上同時在線考試。

表 3:NYCU 已驗證場域與平台能力
已驗證場域 考試情境 規模 已驗證能力
NYCU 資訊與財務工程學系:計算機概論 程式上機測驗 60 人 程式上機等特殊題型可在線上完成作答與監考,不侷限於是非、選擇與填充
NYCU 資訊科學與工程研究所:OS 作業系統 混合題型正式考試 130 人 百人實體教室線上考試可行,考務新增人力大幅下降

(一)、平台功能開發進度

目前版本已能支援教師與助教完成考前、考中與考後的主要工作。下表將功能拆成具體產品 Feature,平台開發狀態以已上線、開發中、規劃中標示;AI Tool 取用狀態則以全面取用、部分介入或 dash 符號標示。

表 4:QJudge 平台功能開發進度
產品 Feature 平台開發狀態 AI Tool 取用狀態 備註
考試建立、題型設定與多題型作答介面 已上線 部分介入 正式課程考試建立;選擇、填空、簡答、開放題與程式上機題;AI 輔助題目草稿與評分規準
程式上機考與自動判題 已上線 部分介入 計算機概論課程實測;程式題、參考解答、測試資料與線上作答
社會科申論與開放題批改 已上線 全面取用 開放題作答、AI 批改與人工複核;適用社會科、商管與通識類問答
理科證明、公式推導與繪圖作答 開發中 部分介入 數學證明、物理推導、化學式與座標圖繪製;降低紙本理科考卷轉線上阻力
文科聽說讀寫評量 規劃中 部分介入 閱讀理解、寫作、口說與聽力題型;語文與人文課程延伸
學生作答與交卷紀錄 已上線 作答狀態、交卷時間與考後回溯紀錄
監考後台、事件記錄與考中螢幕監看 已上線 考生狀態、作答進度、交卷情形、事件記錄與考中螢幕監看
防作弊事件紀錄 已上線 切換視窗、離開作答頁、異常操作與監考標記
AI 批改規準生成與 AI 批改 已上線 全面取用 題目與參考答案生成評分規準;建議分數與評語;教師或助教複核
考試簽到系統模組 開發中 考前到場簽到、身分確認與考生狀態整理
考後統計與弱點分析 開發中 部分介入 題目得分率、班級弱點與個人化回饋
i18n 多語系介面 已上線 中、英、日、韓四國語言切換;利於跨場域使用
第三方平台身份認證檢核 已上線 Google OAuth、校園 SSO、GitHub OAuth;考生身分與登入權限檢核

(二)、場域驗證 1:NYCU 資訊與財務工程學系計算機概論課程

計算機概論課程需要確認學生是否真的具備基礎程式實作能力。對非資工本科系課程而言,教師通常知道想檢核哪些概念,卻不一定有足夠時間設計上機題、測試資料與自動判題規則。QJudge 可讓教師描述考試範圍、題目情境與希望檢核的能力,再透過 AI 協助生成程式題目、參考解答與測試資料,最後由教師或助教確認後上線。

這個場域驗證的重點,不只是把紙本考卷搬到螢幕上,而是讓非本科教師也能更容易設計專業的程式測驗。過去若要考程式,常會退回手寫程式碼,或要求學生在電腦撰寫檔案後再用 USB、雲端連結或分散工具繳交。這些方式都增加監考、收件、版本確認與批改負擔,也很難形成正式、可回溯的考試流程。

計算機概論課程 QJudge 上機考試現場
圖 22:計算機概論上機考試現場。

導入前後的差異,主要體現在題目生成、作答方式與批改資料三個層面:

表 5:計算機概論課程導入前後能力差異
驗證重點 導入前限制 導入後改變
非本科教師出題 程式題、參考解答與測資設計門檻高 AI 題目草稿、參考解答與測資;教師最後審題
程式作答方式 紙筆難驗證可執行性;檔案繳交增加版本管理 平台直接作答;提交紀錄與測資判讀
批改與成績整理 人工判讀程式邏輯、逐題登分與校對 自動判題與成績整理;助教處理例外與爭議
已驗證結果 65 人、5 場、每場 5 題實作題;傳統人工批改與整理約 270.8 小時 主要人力約 20 至 30 小時;節省 240 小時以上

(三)、場域驗證 2:NYCU 資訊科學與工程研究所 OS 作業系統課程

OS 課程驗證的是另一個更直接的問題:傳統紙本閱卷轉成線上電子考試後,考務成本能否明顯下降。這門課包含選擇、填空、簡答與程式撰寫等題型,學生人數也比計算機概論更多。過去若採紙本混合題考卷,教師與助教不只要整理題目、印製與收卷,考後還要面對字跡辨識、答案位置跳躍、作答格式不一致與模糊敘述等問題。這些問題會讓閱卷過程變慢,也容易讓學生在模糊答案或呈現方式上反覆爭取分數,增加複核與溝通成本。

OS 作業系統課程 QJudge 混合題考試現場
圖 23:OS 作業系統混合題考試現場。
表 6:OS 作業系統課程導入前後流程差異
考務環節 導入前:紙本混合題考卷 導入後
考前印製與封存 紙本編排、配分確認、印製、封存與考場資料 題目、配分、名單與作答規則集中設定
考中收發卷與監考 發卷、巡場、收卷、清點與臨場處理 後台查看考生狀態、作答進度與事件紀錄
考後閱卷 分工批改;受字跡、答案位置與格式影響 客觀題先自動判讀;開放題接續 AI 批改與人工複核
登分與複核 人工登分、交叉校對、統計與學生複查 成績整理匯出;回看原始作答、批改與事件紀錄
已驗證結果 130 人、3 場考試;平均每份考卷批改約 0.5 小時;總人工時間約 195 小時 平均每份考卷約 0.1 小時;總時間約 39 小時;約減少 80%

OS 課程驗證的價值在於:當系統能承接更多考生、更開放的題型與更完整的監考紀錄,教師就不必因為缺乏批改人力而縮小考試形式。題目可以更接近真實能力檢核,考後仍保留教師與助教複核,但重複批改與成績整理可被大幅壓縮。

(四)、已驗證的人力節省效益

下表並排兩個 NYCU 場域導入前後的批改與整理時間。QJudge 主要在批改、登分與成績整理這些重複流程上回收人力;試算依考試規模、題型結構與既有作業流程估算,實際效益仍會依題型、複核比例與考試規模調整。

表 7:NYCU 場域導入前後人力節省比較
已驗證場景 考試規模 傳統人工時間 導入後 節省幅度
計算機概論上機考 65 人、5 場、每場 5 題實作題 約 270.8 小時 約 25 小時 約 90%
OS 作業系統混合題考試 130 人、3 場、平均每份考卷 0.5 小時 約 195 小時 約 39 小時 約 80%

以 OS 課程為例,傳統批改下每場考試約需要 65 小時,若由 5 位助教分攤,每人仍要花約 13 小時;導入後,每場批改時間可降至約 13 小時,平均每位助教約 2.6 小時。教師與助教仍然掌握評量品質,但時間會集中在題目品質、爭議題複核與學生學習狀況判讀上。

(五)、下一階段開發重點

下一階段將優先補齊三項擴大導入限制:裝置支援、題型覆蓋與操作學習成本。這些限制會直接影響平台能否從資訊課程延伸到更廣泛的正式考試場景。

題型覆蓋是下一階段最重要的產品方向之一。QJudge 已完成程式上機考、選擇題、填空題、簡答題與開放題的正式考試流程;接下來要補齊的是更接近紙本考卷的理科證明、公式推導、圖形繪製,以及文科聽說讀寫等評量方式。目標不是把所有題型硬塞進一般表單,而是讓不同學科能在合理操作成本下轉為線上正式測驗。

表 8:下一階段開發限制與方向
目前限制 為什麼重要 下一步開發方向
Web App 對平板考試支援不足 iOS、螢幕分享與分裝置作答較難納入完整監考 原生 App、身分確認、監考提醒與平板作答輔助
題型仍需更貼近紙筆考試 理科、社會科與語文課程需要更自然的作答方式 手寫證明、圖表、座標、公式推導、申論與聽說讀寫
教師與助教操作成本仍需降低 高度人工導入會限制課程與機構擴張 題目上架、測前檢查、監考 SOP、批改設定與報表 UX

短期目標是先把 NYCU 場域驗證整理成可複製的導入流程,包含題目上架模板、測前檢查清單、監考 SOP、批改與報表格式。當導入流程可以重複使用,QJudge 才能從單一課程導入,逐步擴展到系所、機構與大型模擬考場景。

五、市場機會:目標客群、市場規模與替代方案

QJudge 的市場切入點,是學校與教育機構中的正式考試與能力檢測場景。這類場景同時需要題目管理、身分確認、監考紀錄、批改複核、成績整理與考後分析;採購動機明確,包含降低考務人力、提高流程可信度、支援跨學科題型,並讓考後資料回到教學改善與機構決策。

(一)、台灣可服務市場

第一階段的可服務市場,以高等教育、實驗教育、機構與檢定單位中的「可實際成交付費單位」作為估算核心。付費單位可以是一門課、一個系所、一個院級中心、一個協會,或是一個檢定專案;這樣的切入方式能讓產品先建立高品質導入案例,再逐步擴張到系所、院級或機構年約。

根據教育部統計,113 學年度台灣大專校院共有 140 所、學生數 1,074,365 人;高級中等學校共有 506 所、學生數約 549,843 人。這些公開母體用來確認需求存在,但早期估算採保守方式,只計入可透過既有場域、教授人脈、合作洽談與機構專案推進的成交單位。

表 9:目標客群與付費單位預估
客群 初期切入對象 第一年預估付費單位 第二年預估付費單位 主要購買形式
高等教育 NYCU 延伸課程、資訊 / 工程 / 商管 / 社科大班、系所中心 6 至 10 個 12 至 20 個 單門課訂閱、學期方案、系所共用
高中與實驗教育 實驗高中、重視素養題或實作評量的高中端單位 1 至 3 個 4 至 8 個 合作試點、學期方案、模擬考服務
機構與檢定單位 協會、研究機構、培訓單位、能力檢核或模擬考主辦單位 2 至 5 個 6 至 12 個 機構訂閱、年度方案、考試點數加購

(二)、台灣現況與市占判讀

台灣線上正式考試市場正處在紙本流程、LMS、通用測驗工具與專用考試系統並行的轉換期。現場需求主要分散在幾種既有做法中:

  1. 學校既有 LMS 或教學平台處理課程公告、線上測驗、作業繳交、成績登記與成績匯出。
  2. 教師與助教用通用測驗或表單工具建立測驗,再搭配 Excel、通訊軟體與人工批改拼接正式考務流程。
  3. 理工科課程會用上機或作業平台處理程式題、實作題或工程類作答,但名單、監考、交卷狀態與考後資料仍常分散在其他工具中。

QJudge 的早期市占目標,會以正式考試事件數、機構專案數與重複使用率來衡量。一所大學每學期有大量課程與正式測驗,只要先切入其中考務成本最高、最需要監考紀錄與跨學科題型支援的 10 至 20 個考試場景,就能形成可驗證的收入、案例與續約基礎。

(三)、競品分析

競品分析聚焦正式考務閉環,而不是單一的線上測驗功能。評估維度包含考前題目與考生管理、考中監考與紀錄、考後批改與資料整理;AI 能力則拆成題目生成與輔助批改兩個面向,因為多數通用測驗平台已開始支援 AI 出題,但不一定能處理開放題批改與教師複核。

下表用功能矩陣整理本產品與常見替代方案的差異。綠色 代表主要功能完整支援,黃色 代表部分支援、需外掛或需人工補流程, 代表通常不是該類產品的主要能力。

表 10:QJudge 與常見替代方案功能比較
重點功能 QJudge LMS 現有測驗平台 表單平台
考試建立與考生名單管理
理工科上機、證明、公式與繪圖題
申論、寫作與口語類評量
考中監考事件與異常回溯
批改矩陣與教師複核
AI 生成題目
AI 輔助批改
成績登記、匯出與班級分析
台灣教育場域導入與客製報表

競品與替代方案可以分成幾類來看:

  • LMS:包含 TronClass、Moodle、Canvas、Google Classroom 等既有教學平台。這類系統擅長課程管理、教材發布、作業繳交、線上測驗、成績登記與匯出,是學校最常見的教學主系統;限制通常不在於「能不能考」,而在於正式考試所需的監考事件、異常回溯、批改複核、跨題型作答資料與客製報表仍要靠外部流程補齊。
  • 現有測驗平台:包含 OnlineExamMaker、Quilgo 等線上測驗產品。這類工具比表單更接近考試情境,通常支援測驗建立、時間限制、題型設定與部分監考功能;限制在於它們多半以通用測驗為核心,對台灣課堂中的理工科上機與證明題、申論寫作與口語類評量、教師複核流程與客製報表仍需要額外整合。
  • 表單平台:包含 Google Forms、Microsoft Forms、SurveyMonkey 等工具。這類產品適合快速收集填答、問卷、簡單測驗與基本統計,也能匯出資料;但正式考試需要的考生名單、監考事件、異常回溯、批改矩陣與成績複核通常要靠 Excel、通訊軟體與人工流程補上。
  • 核心競爭力:QJudge 把題目建立、學生作答、監考紀錄、批改複核、成績整理與考後分析放在同一個正式考務流程中,差異點集中在台灣教育場域導入、跨學科題型支援、考中事件留存與考後資料整理。

(四)、護城河與替代性風險

AI Coding 工具普及後,線上考試系統的基礎功能會更容易被複製。QJudge 需要建立的防禦能力,不只來自軟體功能本身,也來自正式考務場域、導入流程、監考處置經驗與機構信任。以下整理目前較難在短期內複製的累積,以及需要持續管理的外部風險。

防禦能力來自場域累積與導入流程

  1. 教學現場的 Edge case:130 人 OS 期末考遇到考生筆電斷網要怎麼處理、開放題的爭議分數要怎麼複核、實體考場用 QR code 簽到要怎麼擋遠端代考——這類情境需要透過實際考試逐次累積。目前已收集 10 場正式考試的事件紀錄與處置經驗,作為後續導入時的參考依據。
  2. 流程模板已成型:第 4 章列出的測前檢查清單、監考 SOP、批改規範與報表模板,記錄了「在哪些場景下要檢查什麼、爭議題該怎麼判」這類由人決策、由場域校正的標準。這些標準由實際考試逐次補完,每多跑一場考試就會修一輪。
  3. 教育機構接觸與信任:第 6 章列出的已接觸單位(陽明交大、政大、亞太研究院、竹北實驗高中、JUST AI 等),是從教授人脈與實際課堂導入累積而來。正式考試系統要進入課堂或機構流程,除了介面與功能,也需要教師、助教與單位願意把考務流程交給平台承接。

外部風險與應對

表 11
風險 應對方式
AI Coding 降低系統復刻門檻 累積場域案例、流程模板與正式考務驗證
大型 LMS 整合監考與 AI 批改功能 單門課切入,累積機構依賴;長期串接 LMS 與 SSO
法規與個資 考生授權同意流程、合規說明與資料留存政策

場域累積是目前最重要的防禦能力。系統需要在更多正式考試中處理真實異常、批改爭議、監考流程與資料留存,這些經驗會逐步形成導入模板與操作標準。

六、商業模式:潛在導入單位、收費設計與成長路徑

目前已接觸的單位,可分為直接導入、推廣合作與創業支持三類。部分單位適合成為正式測驗或課程導入場域,部分單位則能協助 QJudge 接觸更多教師、學生與教育機構。這些合作尚未全部完成簽約,但都已經過實際洽談,並展現出對可信線上測驗、AI 批改與考後資料整理的需求或推廣意願。

(一)、已接觸的導入、推廣與支持單位

表 12:潛在導入單位與合作定位
單位或場域 合作定位 需求情境或推廣切入 目前狀態
國立陽明交通大學課程場域 既有導入案例 計算機概論、OS 作業系統等大班正式考試 可整理為公開案例
台灣研究與實作協會 推廣合作與機構型試點 線上分科測驗公益模擬考、機構型能力檢測 具推動意願
亞太研究院 推廣合作與機構導入 培訓、研究或能力檢核測驗 首個落地場景評估中
國立政治大學 課程與院級導入 社科大班、開放題與素養型評量 課程或院級導入需求評估中
竹北實驗高中 實驗高中場域 素養題、實作型評量與線上測驗 導入條件評估中
JUST AI 研發中心 AI 教育推廣合作 AI 教育活動、教師推廣與教育場域連結 合作推廣方向洽談中
桃源青年指揮部 / 桃源安東新創基地 創業支持與推廣資源 創業輔導、資源連結與對外推廣 已進駐基地
國立陽明交通大學 Logo
陽明交通大學
亞太綜合研究院 Logo
亞太研究院
國立政治大學 Logo
國立政治大學
竹北實驗高中 U-School Logo
竹北實驗高中
JUST AI 研發中心 Logo
JUST AI 研發中心
桃源青年指揮部與桃源安東新創基地 Logo
桃源青年指揮部 / 桃源安東新創基地

這些單位的付費理由主要來自正式考務流程成本,而非單一作答功能。QJudge 的商業模式對應的是考前題目整理、考中監考紀錄、考後批改、成績匯出與資料分析所帶來的整體考務價值。

(二)、收費設計

收費方式以月費訂閱制為主,搭配點數處理短期使用高峰。單一教師、小型課程或補習班可以從 Basic 開始;多門課、大班測驗或系所單位可升級到 Pro / Max;院級、中心級或機構客戶則採大型機構方案,納入導入規劃、權限設定、資料格式與必要整合服務。

表 13:QJudge 月訂閱方案設計
方案 建議月費 每月考試數 每月 AI 點數 監考與紀錄 適合客戶
Basic NT$3,000 / 月 5 場 1,000 點 即時監控、事件紀錄 單一教師、小型補習班、實驗教育課程
Pro NT$12,000 / 月 30 場 8,000 點 即時監控、事件紀錄、考試錄像保存 大班課程、中型補習班、多門課共用
Max NT$25,000 / 月 80 場 25,000 點 即時監控、事件紀錄、考試錄像保存、Face ID 驗證 系所、中心、教育機構

若客戶超過方案內含額度,可額外購買點數。點數加購不作為獨立方案,而是訂閱客戶的超額使用機制,讓期中、期末、大型模擬考或跨班級使用時的短期高峰有清楚計價方式。

表 14:點數加購項目與單價
加購項目 單價 說明
線上施測點數 NT$5 / 人時 考生人數 × 考試小時數
AI 點數 NT$1 / 點 AI 批改、AI 出題

AI 批改與 AI 出題統一用 AI 點數計算,避免客戶需要理解 token 數量或不同 AI 功能的細項價格。點數消耗會依題目長度、答案長度與模型使用量調整;下表先用常見考務情境提供估算基準,方便客戶在購買方案前估算每月用量。

表 15:AI 點數使用情境與消耗估算
AI 使用情境 點數消耗示意 說明
題目草稿生成與品質檢視 約 5 至 7 點 / 題 依命題方向產生題目草稿,並檢查題幹、答案、配分或評分規準是否清楚
Rubric 生成 約 10 點 / 題 根據題目與參考答案整理評分規準
AI 批改 約 1 至 5 點 / 份答案 依答案長度與題型複雜度計算,涵蓋簡答題、申論題、解釋題與計算過程
單場考後分析 約 100 至 300 點 / 場 整理班級弱點、題目得分率與常見錯誤

例如一場 60 人、5 題開放題的考試,若每份答案平均以 3 點估算,AI 批改約需 60 人 × 5 題 × 3 點 = 900 點。Basic 方案的 1,000 點可支援一場小型開放題批改;Pro 方案的 8,000 點則可支援多場大班考試或搭配考後分析使用。Coding 判題作為平台能力納入方案,不另外拆成獨立收費項目。

(三)、大型機構方案

大型機構通常需要把考試系統放進既有校園或機構流程,因此報價除了使用量,也會納入帳號權限、資料格式、LMS 串接、SSO 身份認證、校務格式整合與教育訓練。這些項目不包進一般 Basic / Pro / Max 方案,而是作為機構導入與客製整合內容。

表 16:大型機構與專案型收費項目
收費項目 建議價格 說明
大型機構月訂閱 NT$40,000 至 NT$120,000 / 月 依使用人數、考試場次、同時在線容量、AI 額度與服務等級報價
一次性技術導入與教育訓練 NT$50,000 至 NT$300,000 帳號規劃、權限設定、管理者教育訓練、教師操作說明、資料格式規劃
LMS 串接 / SSO 身份認證 / 校務格式整合 專案報價 僅提供給大型機構客戶,依整合範圍與技術複雜度報價
私有部署或專屬雲環境 專案報價 適用於資安要求較高、或需專屬環境的機構

(四)、成本與毛利估算

收入主要來自月費訂閱、超額點數加購,以及大型機構導入與客製整合。毛利計算先只看客戶使用平台時會直接增加的成本,例如雲端主機、資料庫、儲存、頻寬、AI token、平台運算、監控備份與基礎客服;工程、產品、行政與行銷則列為公司營運費用。

表 17:QJudge 主要成本結構估算
成本項目 估算方式 目前估算
線上施測流量 月施測人時 × 雲端 / DB / 頻寬成本 約 NT$0.2 / 人時
AI 點數使用 月 AI 點數 × 平均 token 成本 約 NT$0.2 / 點
平台運算資源 月施測、作答與程式執行所需運算 約 NT$0.1 / 人時
工程 / 產品人力 產品開發、維護、修 bug、功能迭代 約 NT$100,000 / 月
公司維持營運成本 工具、網域、行政、會計、基本雜支 約 NT$10,000 至 NT$20,000 / 月
月總成本 ≈ NT$165k (基準月)
  1. 工程 / 產品人力 60%
  2. 線上施測流量 12%
  3. AI 點數使用 12%
  4. 公司維持營運 10%
  5. 平台運算資源 6%
圖 24:基準月成本占比估算。

以基準月估算,若月收入約 NT$175,000,平台直接成本約占 28%,則月毛利約 NT$126,000,毛利率約 72%。第一年在客戶數不足時可能接近損益兩平或小幅虧損;當月收入成長至約 NT$500,000 以上,固定人力與營運成本被攤薄,訂閱收入就能開始支撐公司獲利。

(五)、三年營收規劃

NT$ 萬 1,500 1,000 500 0 NT$200 萬 NT$600 萬 NT$1,500 萬 第 1 年 第 2 年 第 3 年 Pro 100 · Max 60 · Basic 30 · 點數 10 Pro 260 · Max 230 · Basic 50 · 點數 60 Max 720 · Pro 500 · 點數 200 · Basic 80
圖 25:三年營收目標趨勢(NT$ 萬)。
表 18:三年營收目標與收入流構成(依據)
年度 Basic 訂閱 Pro 訂閱 Max / 大型機構訂閱 點數加購 年營收目標
第 1 年 NT$30 萬 NT$100 萬 NT$60 萬 NT$10 萬 NT$200 萬
第 2 年 NT$50 萬 NT$260 萬 NT$230 萬 NT$60 萬 NT$600 萬
第 3 年 NT$80 萬 NT$500 萬 NT$720 萬 NT$200 萬 NT$1,500 萬

第 1 年重點是建立可公開案例與首批付費客戶;第 2 年提高 Pro、Max 與機構方案收入占比;第 3 年擴大型機構訂閱與續約收入。若以工程 / 產品人力 NT$100,000 / 月、公司維持營運成本 NT$15,000 / 月估算,第 1 年仍可能小幅虧損,第 2 年起有機會轉正。

(六)、市場導入策略與里程碑規劃

0 個月 4 8 12 16+
PHASE 1 · 0–4 個月 產品開發與驗證
PHASE 2 · 4–8 個月 專案導入
PHASE 3 · 8–12 個月 擴張導入
PHASE 4 · 12+ 個月 產品化
▲ 目前
圖 26:四階段市場導入時程

Phase 1 · 產品開發與驗證(0–4 個月,目前)

目前在 NYCU 兩門課累積 10 場正式考試的實證紀錄,包含監考、批改流程與 edge case 處置經驗。第 3 個月重點是把這些沉澱成測前檢查、監考 SOP、批改規範與報表模板,作為下一階段帶到外部機構的可複用導入文件。

Phase 2 · 專案導入(4–8 個月)

把導入流程帶到陽明交大延伸課程、亞太研究院、JUST AI 等已洽談單位。每個案子是「客製化導入 + 收費試點」並行,目標是首批付費案例與一份成熟的導入交付手冊。

Phase 3 · 擴張導入(8–12 個月)

導入流程穩定後,焦點從單一場域轉向多機構複製。目標擴大到政大、竹北實驗高中等已建立關係的單位;重點不在新功能,而在流程跨機構落地的順暢度與續用率。

Phase 4 · 產品化(12+ 個月)

當導入不再需要個別專案介入、月費訂閱有穩定基底,重點轉到續約率、客單價提升、跨學科題型(理科證明、文科聽說讀寫)的開放時機,以及長期的機構年約與大型客戶合作。

七、團隊執行能力與組織化推進:從教學現場到產品化

(一)、從教學現場走向產品實作

目前以一人公司型態推進,由我主導產品開發、介面設計、考務流程規劃、場域導入、商業驗證與對外合作。這種工作型態需要的不只是工程能力,而是能同時理解教育現場、系統開發、使用者溝通與專案交付。生成式 AI 工具也放大了一人團隊的開發量能,使早期原型、文件、流程驗證與產品迭代能在較小團隊規模下完成。

這個題目不是只來自單一資訊課程,而是長期在不同教學現場看到同一類問題:老師想設計更好的評量,助教需要處理大量行政與批改工作,學生則需要更清楚、公平、可信的作答與回饋流程。不同課程的題型、學生背景與評量方式不同,但最後都會回到出題、作答、監考、批改、登分與回饋之間的流程斷裂。

在產品開發之外,我也長期投入不同類型的教學現場。這些助教經驗橫跨語言、通識、資訊服務、大一基礎課程與研究所技術課程,讓我熟悉課程執行、教材準備、學生互動與考務支援的實際細節。這些經驗讓我不是只從工程角度看教育產品,而是能理解教師、助教與學生各自承受的壓力。

表 19:創辦人主要助教經驗
助教經驗 年限 主要負責內容與教學經驗
大一英文助教 1 年 口說、寫作、文章修訂與課堂教材。
大一資訊服務課程助教 2 年 校園資訊服務、數位工具與新生系統操作。
通識課程 AI 人工智慧專題助教 1 年 AI 基礎概念、工具使用與專題討論。
碩班計算機網路助教 2 年 作業討論、實作支援與網路協定概念。
OS 作業系統助教 2 年 題目說明、學生問題、考後批改、登分與複核。
大一計算機概論助教 1 年 上機練習、考試流程與學生實作問題處理。

(二)、經歷與能力累積

產品判斷建立在教學現場,也需要系統開發、企業專案與創業資源支撐。校內資訊技術服務中心的開發經驗,補上平台架構、權限、穩定性與校園系統情境;IBM Taiwan 實習與 AI Agent 產品經驗,補上需求釐清、客戶溝通、AI 工具導入與交付節奏;桃源青年指揮部與桃源安東新創基地,則提供早期創業支持與外部合作連結。

表 20:創辦人經歷與累積能力
經歷 累積能力
多元課程助教與考務現場 課堂帶領、學生溝通、教材準備、作業協助與考務支援。
校園系統開發 SSO Portal、舊系統重構、UI 改版、雙因素驗證與權限控管。
IBM Taiwan 實習與企業專案 需求訪談、系統開發、客戶溝通與交付流程。
AI Agent 產品經驗 需求拆解、流程設計、AI 工具導入與營運場景調整。
創業基地與外部資源 透過桃源青年指揮部與桃源安東新創基地,接觸創業輔導、合作資源與潛在場域。
領導獎學金與競賽經驗 蔡力行傑出領導獎學金、技術競賽、跨團隊協作與短期交付。

整體而言,這些經歷讓我同時具備教學現場理解、系統開發、企業需求溝通、AI 導入與專案推進能力。它們不需要逐項對應到單一功能,但共同構成我推動教育科技產品與正式線上考試平台的能力基礎。

IBM Taiwan 團隊合照
圖 27:IBM Taiwan 實習與企業專案經驗。
大學傑出領導獎學金經歷
圖 28:蔡力行傑出領導獎學金。
2026 TSMC IT CareerHack 分組第一名
圖 29:2026 TSMC IT CareerHack 分組第一名。

(三)、下一階段組織化規劃

一人公司適合快速完成 0 到 1:創辦人可以直接處理產品開發、課堂導入、教師溝通、測試回饋與早期商業洽談。但若要從單門課試點擴大到系所、機構與檢定單位,下一階段必須逐步補上教育市場、客戶導入、技術維護與財務營運能力。

組織化不會一開始就擴張成完整公司編制,而是先用專案合作、實習生、顧問與外部資源補足關鍵缺口;等付費導入案例增加後,再依照收入與導入壓力轉為固定角色。下一階段預計補強的能力如下:

表 21:下一階段組織能力規劃
角色或能力 補強原因 初期合作方式
教育市場與課程顧問 不同科系、補教、實驗教育與檢定單位需求判斷 教師、助教與教育工作者顧問
客戶導入與使用者成功 測前設定、監考 SOP、教師訓練、回饋與續約 專案合作或實習生支援,建立導入包
技術維護與資安工程 穩定性、尖峰流量、資料備份、權限與機構整合 付費導入後補後端、DevOps 或資安人力
AI 與題型研發 理科證明、繪圖題、聽說讀寫與 AI 批改規準 研究專案、學生合作或外部技術顧問
財務、行政與合約管理 報價、合約、補助、發票、會計與營運流程 初期外包會計與行政;收入穩定後建立營運支援

這樣的規劃能保留早期團隊的速度,同時逐步補上擴張所需的組織能力。短期目標不是立刻建立大型團隊,而是把已驗證的產品能力轉成可複製的導入流程,並在每一個付費或準付費場域中補強對應角色。

(四)、我和米花科技的公司願景

米花科技想做的,不只是把既有流程數位化,而是探索未來新型態的 Agent 人機互動。AI Agent 不應該被簡化成「取代人工」的工具;更重要的問題是,人與 Agent 如何在同一個流程中分工、互補,讓人的判斷、經驗與責任被保留下來,同時讓 Agent 承擔整理、生成、提醒、初步判讀與重複性工作的成本。

QJudge 是這個願景在教育場域的第一個落地案例。正式測驗需要公平、可信與可回溯,也需要教師保留最後的命題、評分與教學判斷。系統中的 AI 可以協助生成題目草稿、整理評分規準、初步批改開放題與歸納考後資料,但不取代教師與助教的專業決策。真正有價值的設計,是讓 Agent 補上人力最耗損的環節,讓人回到題目設計、學習判斷與學生回饋。

這樣的人機協作也會改變未來的評量形式。學生不一定只是在系統中回答標準答案,也可能需要操作 AI、判斷 AI 回覆、整合資料、完成報告或與 AI 考官進行一對一問答。此時要被評量的,不只是記憶了多少內容,而是能不能理解問題、組織資訊、使用工具、做出判斷並完成真實任務。

公司的長期方向,是從台灣教育現場出發,先用 QJudge 建立可信任的正式測驗流程,再逐步延伸到更多人與 Agent 協作的工作情境。目標不是讓 Agent 接管人的角色,而是讓人與 Agent 在清楚的責任分工下合作,形成一加一大於二的工作方式。

米花科技品牌願景圖
圖 30:米花科技品牌願景。
QJudge 產品執行計劃書

QJudge

AI 已經改變了學習,QJudge 讓正式測驗跟上這個時代。

從真實課堂考務出發,建立更公平、可信、可回溯的正式測驗流程。

QJudge 米花科技 QJudge 產品執行計劃書