米花科技 QJudge 產品執行計劃書

QJudge

下世代的數位學習體驗

AI 已經改變了學習,現在輪到測驗。

當學生用 AI 寫作業、用 AI 整理筆記、用 AI 解題的同時,學校仍只能用最傳統的紙本測驗作為唯一的驗收手段。學習跟學懂之間,隔著一個還沒被解決的問題:AI 時代的「正式評量」該長什麼樣子,是否還需要停留在一成不變的考卷之上。QJudge 想擔任這個先行者,讓學習成果檢驗重新跟上學習的步伐。

QJudge 米花科技 QJudge 產品執行計劃書

目錄

一、創業動機:從真實考務現場出發

(一)、紙本型態評量的限制

在擔任管理學院大一計算機概論助教時,我看到了舊有評量方式的限制,也看見了它能變的可能性。

計算機概論希望檢核學生的基本程式能力,但實際評量常被迫用紙筆——學生在考卷上手寫程式碼,或用偏知識記憶的題目取代本來應該有的上機實作。這種方式的限制相當清楚:

  1. 很難看出學生能不能自主撰寫、執行並除錯一段程式。
  2. 不同字跡、格式與每位同學跳躍式的寫法,會讓批改速度變慢,標準也不容易一致。

AI 工具普及後,回家作業作為正式評量依據的可信度開始下降——當無法判斷一份作業是否由 AI 代為完成,越來越多老師把作業、報告或能力檢核搬回課堂現場,考試次數因此開始倍增。但每一場紙本考試的考務成本(送印、封存、發卷、收卷、批改、登分)並沒有跟著縮小;事實上,它反過來成為壓縮教學設計空間的主因。老師明明知道有更好的評量方式,最後卻被行政成本逼回選擇題與填充題。

(二)、從測驗工具走向正式考試系統

因此,我先幫管理學院的老師們做出第一版線上程式測驗平台——教師與助教可以在平台上出題、辦考試與監考;學生在線上作答;系統自動判題並整理結果。整個流程不需要學生安裝任何 App,也不依賴斷網處理考場管制;它從一開始就被設計成可以在現有教室裡跑起來。

平台上線後,其他大學的老師也希望把這套系統用在自己的課堂。其中一門約 130 人的課,原本採用紙本考卷搭配 10 到 20 題開放式問答;考試規模龐大,但對應的助教資源相當稀缺——少數助教在期末必須面對上百份混合題型考卷的批改、成績整理與爭議處理,紙本批改幾乎無法在合理時間內完成。當需求從「程式上機」延伸到「大規模監考 + 開放題批改」,原本的線上判題工具被迫長大,逐步演化成承擔監考、批改與成績整理的完整考務系統。

從這些教學現場我看見的是一個更系統性的問題:AI 時代不會讓考試消失,反而會讓「值得信任的正式評量」變得更稀有、也更必要。當學生可以用 AI 整理筆記、生成草稿、解開大部分課本題目,老師真正需要的不是更多防堵工具,而是一個能讓新形態評量落地的基礎建設。QJudge 想做的,就是先把這座基礎建出來。

二、問題洞察:AI 時代下正式測驗的缺口

第一版系統先解決一門課的考務問題:怎麼讓老師出題、學生作答、助教監考與批改都在同一個線上環境完成。往外看,這個壓力也出現在其他課程與機構場域;當回家作業的可信度下降,更多學習檢核會回到課堂與正式測驗,題目整理、監考可信度、批改登分與資料留存都會成為負擔。

(一)、痛點一:行政成本壓縮教學品質

教師應該把更多資源投注在教學設計、題目品質與學生理解,但現場常被繁瑣的行政成本拉走。一場紙本考試從考前到考後,會經過很多看似理所當然、實際上很耗人力的流程。教授可能先用 Word 出題,再交給助教檢查格式、配分與題目敘述,有些考試還需要送交學校或單位審批。題目確認後,紙本考試還要送印、封存,考場當天再由助教或監考人員整理考卷、發卷、收卷、清點份數。

考試結束後,工作還沒有結束。考卷收回來後,老師與助教要在紙本上逐份批改,再把分數登記到成績表,遇到開放題、問答題或需要部分給分的題目,還要反覆校對標準與分數。當學生人數增加,這些工作會變成大量的人事成本。

這些行政成本累積起來,會反過來限制老師設計考試的意願。老師可能知道程式上機考、開放式問答、實作題更能反映學生能力,但只要想到後續批改與整理成本,就很容易退回選擇題、是非題與填充題。AI 已經讓知識取得與生成變得更容易,教育測驗卻仍被迫停留在比較僵化的題型;問題往往不在老師缺乏想像,而在行政成本讓考試變化很難被執行。

圖:一場 60 人混合題型考試的教師與助教時間分配(估算)。重複勞動佔絕大多數,能投入「下次題目要更好」的時間極少。
  • 出題與題目 review 2 hr
  • 考前準備(印製、封存、考場) 1 hr
  • 監考與發收卷 1.5 hr
  • 考後人工批改 25 hr
  • 登分、爭議處理與成績整理 1.5 hr
  • 能投入題目品質設計與教學調整 < 1 hr

總計 約 31 小時 的考務工作中,真正能用來思考「下次題目要怎麼出得更好」、「哪些觀念需要在課堂補強」的時間,不到 3%。這也是為什麼老師寧可選擇選擇題與填充題——不是缺乏想像,而是行政成本不允許更困難的題型。

(二)、痛點二:線上考試缺少可信的防作弊與監考流程

老師不願意把正式考試搬到線上的原因很直接:怕學生作弊。學生可能切換螢幕查資料、截圖題目傳給別人、用通訊軟體求助,或直接把題目丟給 ChatGPT 生成答案。只要這些行為沒有被記錄,老師就很難相信線上考試的結果。

現行常見做法大多是在考試外面再加一層限制:

  1. 使用網路限制:限制校內 IP、固定考場或指定網段,要求學生在特定地點作答。
  2. 斷開網路:用斷網或局域網環境降低查資料、通訊與外部協作的可能。
  3. 使用 Safe Exam Browser 或客製化 App:要求學生安裝指定瀏覽器或考試 App,限制切換視窗、截圖與外部程式。

這些措施可以降低部分風險,但也讓線上考試變得很難推進。教師要處理設備、網路、安裝、相容性與考場管理;學生也必須配合額外設定。當一場線上考試仍然需要大量物理限制與前置準備才能執行,老師與學校自然會傾向繼續使用紙本或傳統考場。

核心問題在於把防作弊與監考流程做進線上考試本身。系統會保存監考狀態、切換視窗或異常事件、交卷紀錄與作答資料,讓考後可以回看。它不承諾消滅所有作弊,但要讓線上考試從「無法信任」變成「有紀錄、可追溯、可判斷」。

(三)、痛點三:考試資料分散,LLM 分析難以落地

現在大家都在談 LLM 導入教育,但 LLM 要做出有用的分析,前提是資料能被取得、被整理、被調用。更重要的是,這些資料必須來自受信任的正式測驗環境。學生在正式測驗中產生的作答紀錄、交卷紀錄、批改結果與監考事件,才是後續做學習分析、題目分析與教學調整時最關鍵的資料。

考試如果仍以紙本為主,考後資料會散在試卷、答案紙、人工批改紀錄與 Excel 成績表裡。教師若想用 LLM 做考試總結、強弱項分析或題目鑑別度分析,還要先掃描紙本、整理題目、轉錄答案、對齊分數,才能把資料交給模型。這個流程很不合理。既然考試本身會產生題目、作答、分數、批改紀錄與監考事件,這些資料就應該在考試發生時被集中到同一個平台。

第一步是把正式考試流程數位化,讓題目、答案、批改、成績與監考紀錄能被整理成結構化資料。等資料基礎建立起來,後續才有條件用 LLM 做班級總結、個別學生弱點、題目品質與鑑別度分析。

(四)、產品方向與教育想像

AI 進入教育後,最先被看見的改變,是學生變得更容易取得知識。ChatGPT、NotebookLM、AI 助教與各種學習工具,都在幫學生整理資料、生成筆記、獲得即時解答,或用更個人化的方式學習。這些工具確實讓學習過程變得更有效率,也讓學生的自我調節能力與判斷能力變得更重要。

但教育也需要「正式檢核」。當學生可以用 AI 完成回家作業、整理報告或生成答案,學校更需要一個可信的方式,確認學生是否能在規則下使用知識、完成任務並說明判斷。

產品方向是先把正式測驗的基礎建設做好。也就是先讓教師可以在同一個受信任的線上環境中建立題目、執行考試、掌握監考紀錄、完成批改、匯出成績,並把題目、作答、分數與事件紀錄整理成可回溯的資料。這一步看起來不花俏,卻是後續所有 AI 應用的前提。

在這個基礎上,系統才會延伸 AI 批改、考後分析、個人化回饋與 AI 協作型測驗。未來的考試不必只停在選擇、填充與是非題,學生也可能需要操作 AI、判斷 AI 回覆、整合資料並完成任務;這類評量必須建立在可信、可回溯的考試資料之上。

QJudge 可信考試服務與 AI 加值概念圖
圖:以可信考試服務作為基礎,再向上延伸 AI 加值能力與新型態評量。
未來 AI 協作型數位考試示意圖
示意圖,非真實系統畫面:學生在受信任的作答環境中,與 AI 協作完成需要推理、計算與整理報告的物理挑戰題。
AI 考官一對一線上考試示意圖
示意圖,非真實系統畫面:AI 考官可在正式線上測驗中與學生一對一互動,追問推理過程並記錄作答脈絡。

三、解決方案:半 AI 輔助、流程可信任的線上考試平台

解決方案是把考前準備、考試進行與考後處理整併在同一個系統中,並在關鍵環節加入 AI 輔助與人工複核。系統負責整理流程、保存紀錄與降低重複工作;教師仍保留題目品質、評分標準與正式採用的最後決定權。

考試環節 原始考試方式 解決方案
考前準備 Word 出題、人工 review 題目、Excel 管理名單,配分、規則、身分認證與簽到流程分散在不同工具中 在同一個後台整理題目、AI 輔助出題與品質檢視、由教師確認正式題目,並管理考生名單、到場簽到或遠端身分認證
考試進行:學生作答 紙本、表單或多個平台分散作答,交卷狀態與可疑行為需要人工確認 學生在同一個受保護的正式作答環境完成計時、作答、交卷與作答紀錄保存
考試進行:主辦與監考 靠點名、巡場、截圖、通訊軟體與口頭回報掌握狀況,考後難以回溯 教師、助教或機構可透過監考證據鏈查看學生狀態、防作弊事件、截圖紀錄與監考標記
考後處理 紙本批改、人工登分、Excel 校對,題目資料、作答資料與成績資料彼此分散 自動判題、AI 批改、人工複核、成績匯出與考後分析接在同一條流程上

(一)、考前準備

考前準備的首要工作,是把題目整理成可以正式執行的測驗。AI 可以協助生成題目草稿、檢查題幹、答案與評分規準,但題目是否採用、難度是否合適、配分是否合理,最後仍由老師決定。完成題目後,平台再接著整理考生名單、作答規則與身分認證流程,讓實體線上考或遠端線上考都能在同一套流程中完成。

  • 題目整理、review 與 AI 品質檢視:教師可在平台中整理題目,AI 協助產生題目草稿、檢查題幹、答案與評分規準;正式題目仍由教師確認,避免開考後才發現敘述不清或標準不一致。
  • 題型設定、配分與作答規則管理:支援選擇、填空、簡答、開放題與 Coding 上機題,並集中設定考試時間、題目配分、作答限制與交卷規則。
  • 考生名單與身分認證:將考生名單、考試權限與身份確認集中管理;實體考場可使用到場簽到,遠端考試則可使用 Face ID 掃描或臉部識別作為身分確認流程。
QJudge 題目管理與題型設定畫面
圖 1:題目管理與題型設定畫面。教師可在後台整理題目、設定題型與管理考試題目內容。
AI 出題輔助畫面
圖 2:AI 出題輔助畫面。教師可用 AI 協助整理命題方向、產生題目草稿與確認考試內容。
教室成員管理畫面
圖 3:教室成員管理畫面。教師可集中查看教師與學生名單,作為考試發布與權限控管基礎。

(二)、考試進行

考試進行時,系統同時需要滿足兩種使用者:一是作答者本身,二是監考人員。對作答者而言,系統要提供接近紙筆考試的直覺作答體驗,同時保留數位化在計時、交卷、紀錄保存與後續批改上的優勢;對監考人員而言,系統要讓考場狀態清楚可見,並把必要事件留下來供考後確認。

  • 環境確認與保護:考生依規則開啟鏡頭、分享螢幕並切入全螢幕模式。
  • 紙筆感的數位作答:選擇、填空、簡答、開放題與 Coding 上機題可以放在同一場考試中,讓學生用接近紙筆考試的節奏作答,同時保留自動存檔、快速交卷與資料整理的優勢。
  • 事件紀錄與截圖:焦點離開、全螢幕中斷、螢幕分享異常或監考標記會被記錄,並保留必要截圖。
  • 作答狀態保存:系統保留作答進度、交卷時間、作答狀態與監考事件,供考後批改與爭議處理使用。
QJudge 學生考前環境檢查畫面
學生端畫面:考生進入考場前完成環境檢查、Webcam 授權、全螢幕模式與互動檢測。
QJudge 學生考試儀表板畫面
學生端畫面:考試儀表板集中顯示考試時間、規則、成績狀態與作答紀錄。
QJudge 學生正式作答畫面
學生端畫面:正式作答介面支援多題型、即時儲存、題目切換與交卷流程。

QJudge 目前已做的防作弊與監考手段如下:

防作弊或監考手段 QJudge 作法 助教端使用方式 強制性
頁簽切換偵測 偵測學生是否切換頁簽或離開作答頁面,並留下事件紀錄 監考端可查看事件發生時間與學生狀態 強制
滑鼠離開事件偵測 偵測滑鼠是否離開作答視窗或主要作答區域 異常事件會集中顯示,方便助教快速判斷 強制
要求螢幕分享 可要求學生在考試期間分享螢幕,作為正式線上測驗的監考依據 助教可確認螢幕分享狀態,必要時點看監考畫面 可選
要求開鏡頭 可要求學生開啟鏡頭,配合遠端或混合場域的身分與狀態確認 助教可隨時進入監考,點看學生監考畫面 可選
實體 QR code 簽到紀錄 考生需在實體考場掃描 QR code 完成簽到,降低遠端代考或未到場作答風險 助教可查看簽到紀錄,對照考生名單與作答狀態 可選
單一裝置登入限制 考試開始時清空學生既有裝置登入紀錄,限制考試期間僅能使用單一裝置作答 異常登入或重新登入會留下紀錄,方便助教判斷是否需介入 強制
學生離線檢測 偵測學生是否離線或中斷連線 監考端會標示離線狀態,協助助教即時處理 強制
學生畫面訊號斷連檢測 偵測螢幕分享、攝影機或監考畫面訊號是否斷連 斷連事件會被記錄,供考中處理與考後回溯 可選
離開全螢幕檢測 偵測學生是否離開全螢幕作答模式 系統留下事件紀錄,助教可回到同一份監考紀錄檢視 強制
助教即時監考 助教可進入監考後台查看考生在線狀態、作答進度與交卷狀況 可隨時點開單一學生的監考畫面,集中處理可疑事件 可選
QJudge 助教監考畫面監視截圖
助教端監考畫面:監考人員可點選學生,查看即時螢幕分享、考試事件與作答狀態。
QJudge 助教監考事件紀錄截圖
助教端事件紀錄:異常事件會保留時間、原因、證據來源與截圖證據,供考中處理與考後回溯。
QJudge 實際考場監考畫面
考中現場:實際考場中,助教可搭配 QJudge 監考後台掌握學生作答與異常事件。
QJudge 監考學生詳細資訊總覽
監考端畫面:學生詳細資訊可查看作答狀態、連線狀態、監看狀態與考試分數。
QJudge 監考學生考試事件紀錄
監考端畫面:事件紀錄保留登入、進入考試、螢幕分享、全螢幕與離開視窗等可回溯紀錄。
QJudge 監考學生作答報告
監考端畫面:作答報告可檢視每題作答狀態、批改結果與得分,供考後複核使用。

(三)、考後批改、資料整理與分析

考後處理的目標,是讓分數計算、批改、登分、複核與資料分析能接在同一條流程上完成。這個階段應具備以下功能:

  • 自動判題:客觀題與程式題可由系統先完成判讀,減少重複批改。
  • AI 批改:開放題可由 AI 根據題目、參考答案與 rubric 產生建議分數與評語。
  • 人工複核:正式分數仍保留教師或助教複核,避免 AI 直接取代評分責任。
  • 成績匯出與校對:批改完成後可匯出成績與作答資料,降低登分與校對成本。
  • 考後分析:整理題目得分率、常見錯誤、班級弱點與個人作答狀況,作為後續教學檢討依據。
AI 批改標準生成畫面
圖 5:AI 批改標準生成畫面。系統可根據題目與參考答案整理評分規準,作為 AI 批改與人工複核依據。
AI 批改執行畫面
圖 6:AI 批改執行畫面。系統依評分規準對學生答案產生建議分數與評語,教師或助教可再進行複核。
QJudge 考試批改成績矩陣
考後畫面:批改成績矩陣可快速查看各學生、各題目的得分與批改狀態。
QJudge 考試題目分析儀表板
考後畫面:題目分析儀表板可檢視得分率、分數分布與不同題目的鑑別狀況。
QJudge AI 考試分析畫面
考後畫面:AI 考試分析可協助整理題目鑑別度、班級強弱項與後續教學回饋。

四、產品進展:平台功能開發進度與場域驗證

目前已完成正式線上考試的主要平台功能,並在 NYCU 真實課堂中完成場域驗證。平台已服務超過 200 位考生,籌辦 10 次正式或課程測驗,並驗證系統可支援百人以上同時在線考試。

已驗證場域 考試情境 規模 已驗證能力
NYCU 資訊與財務工程學系:計算機概論 程式上機測驗 60 人受測 驗證程式上機等特殊題型也能在線上完成作答與監考,不限於是非、選擇、填充等一般題型
NYCU 資訊科學與工程研究所:OS 作業系統 混合題型正式考試 130 人受測 驗證實體教室線上考試可行,並確認系統可大幅降低考務新增人力

(一)、平台功能開發進度

目前版本已能支援教師與助教完成考前、考中與考後的主要工作。下表將功能拆成具體產品 Feature,平台開發狀態以已上線、開發中、規劃中標示;AI Tool 取用狀態則以全面取用、部分介入或 dash 符號標示。

產品 Feature 平台開發狀態 AI Tool 取用狀態 備註
考試建立、題型設定與多題型作答介面 已上線 部分介入 已支援正式課程建立考試,並支援選擇、填空、簡答、開放題與 Coding 上機題;AI 可輔助整理題目草稿與評分規準
學生作答與交卷紀錄 已上線 保留作答狀態、交卷時間與考後回溯所需紀錄
監考後台、事件記錄與考中螢幕監看 已上線 支援查看考生狀態、作答進度、交卷情形、事件記錄與考中螢幕監看
防作弊事件紀錄 已上線 可紀錄切換視窗、離開作答頁、異常操作與監考標記
AI 批改規準生成與 AI 批改 已上線 全面取用 可依題目與參考答案整理 rubric,並產生建議分數與評語;正式分數仍保留教師或助教複核
考試簽到系統模組 開發中 用於考前到場簽到、身分確認與考生狀態整理
考後統計與弱點分析 開發中 部分介入 目標是整理題目得分率、班級弱點與個人化回饋
i18n 多語系介面 已上線 已支援中、英、日、韓四國語言切換,利於後續跨場域使用
第三方平台身份認證檢核 已上線 已支援 Google OAuth、校園 SSO、GitHub OAuth 等身份來源,並檢核考生身份與登入權限

(二)、場域驗證 1:NYCU 資訊與財務工程學系計算機概論課程

計算機概論課程需要確認學生是否真的具備基礎程式實作能力。對非資工本科系課程而言,教師通常知道想檢核哪些概念,卻不一定有足夠時間設計上機題、測試資料與自動判題規則。QJudge 可讓教師描述考試範圍、題目情境與希望檢核的能力,再透過 AI 協助生成合理的程式題目、參考解答與測試資料,最後由教師或助教確認後上線。這讓程式實作題不再只適用於資工課,也能被帶進管理、財務或通識型資訊課程。

計算機概論課程 QJudge 上機考試現場
圖 4:計算機概論課程實際上機考試現場。學生使用教室電腦於 QJudge 平台完成程式測驗。

導入前後的差異可以拆成考前、考試進行與考後三個階段來看:

比較項目 導入前:紙本或半數位流程 導入後
原本考試形式 學生以紙筆手寫程式碼,或以分散工具繳交答案,助教需要人工判讀程式邏輯與結果 學生在平台上直接完成上機作答,系統依測資自動判題
考前準備時間 教師先出題並以 Word 編排題目,助教或課程單位再審題、確認格式與配分;若使用紙本,還要處理印製、封存與考場發放 教師與助教在後台建立題目、測資、配分與考生名單,不需印製考卷
考試進行人事成本 監考人員需發卷、收卷、清點份數,並確認學生是否完成繳交 監考人員可從後台查看作答狀態、交卷情形與事件紀錄
考後人事成本 助教需逐題人工批改手寫程式碼,再登分、校對與整理成績 系統自動判題並匯出成績,助教主要處理例外題、爭議題與結果確認
已驗證結果 依 65 人、5 場、每場 5 題實作題估算,傳統人工批改與整理約需 270.8 小時 導入後主要人力降至約 20 至 30 小時,預計節省 240 小時以上

(三)、場域驗證 2:NYCU 資訊科學與工程研究所 OS 作業系統課程

OS 課程包含選擇、填空、簡答與程式撰寫等題型,學生人數也比計算機概論更多。過去若採紙本混合題考卷,教師與助教不只要整理題目、印製與收卷,考後還要面對字跡辨識、答案位置跳躍、作答格式不一致與模糊敘述等問題。這些問題會讓閱卷過程變慢,也容易讓學生在模糊答案或呈現方式上反覆爭取分數,增加複核與溝通成本。

OS 作業系統課程 QJudge 混合題考試現場
圖 5:OS 作業系統課程實際考試現場。學生於教室內使用自己的筆電進行混合題型線上測驗,助教可透過 QJudge 後台掌握作答與監考狀態。
比較項目 導入前:紙本混合題考卷 導入後
原本考試形式 學生使用紙本考卷作答,包含選擇、填空、簡答與手寫程式碼 學生在同一個線上考試介面完成混合題型作答
考前準備時間 教師先出題並以 Word 編排混合題型,助教或課程單位再審題、確認配分、印製考卷、封存與準備考場資料 題目、配分、考生名單與作答規則可在平台集中設定,不需處理紙本印製與封存
考試進行人事成本 130 人考場需要多位助教發卷、巡場、回收考卷、清點份數與處理臨場狀況 監考人員可透過後台查看考生狀態、作答進度、交卷情形與事件紀錄
考後人事成本 多題型考卷需要分工批改、人工登分、交叉校對與整理統計 系統先完成客觀題與可自動判讀題型,AI 批改與人工複核接在同一流程,成績可集中整理
已驗證結果 依 130 人、3 場考試估算,平均每份考卷批改約 0.5 小時,總人工時間約 195 小時 導入後平均每份考卷約 0.1 小時,總時間約 39 小時,約減少 80%

OS 課程驗證的價值在於:當系統能承接更多考生、更開放的題型與更完整的監考紀錄,教師就不必因為缺乏批改人力而縮小考試形式。題目可以更接近真實能力檢核,考後仍保留教師與助教複核,但重複批改與成績整理可被大幅壓縮。

(四)、下一階段開發重點

下一階段開發重點不是單純增加功能,而是補齊目前平台在擴大導入時會遇到的三個限制:裝置限制、題型限制與操作學習成本。這些限制會直接影響平台能否從資訊課程延伸到更廣泛的正式考試場景。

目前限制 為什麼重要 下一步開發方向
Web App 對平板考試支援不足 目前正式作答主流程以 Web App 為核心。受 iOS 瀏覽器與螢幕分享等技術限制影響,使用平板或分裝置作答的學生較難完整納入監考流程。 開發原生 App,先支援身分確認、監考提醒、裝置狀態回報與平板作答輔助,再逐步補齊平板考試體驗。
題型仍需更貼近紙筆考試 若要進入微積分、化學、物理、經濟學等課程,考試不能只停留在選擇、填空、簡答與一般文字作答。 增加手寫證明、繪製圖表、座標標註、公式推導與圖形化作答等題型,讓更多紙本考卷能轉為線上測驗。
教師與助教操作成本仍需降低 若每次導入都需要高度人工協助,產品就難以快速擴張到更多課程與機構。 強化題目上架、規則設定、測前檢查、監考 SOP、批改設定與報表產出的 UX,並加入 AI 協作,協助教師把考試範圍轉成題目、rubric 與測試資料。

短期目標是先把 NYCU 場域驗證整理成可複製的導入流程,包含題目上架模板、測前檢查清單、監考 SOP、批改與報表格式。當導入流程可以重複使用,QJudge 才能從單一課程導入,逐步擴展到系所、機構與大型模擬考場景。

五、市場機會:目標客群、替代方案與人力節省

QJudge 的市場切入點,是學校與教育機構中的正式考試與能力檢測場景。這類場景同時需要題目管理、身分確認、監考紀錄、批改複核、成績整理與考後分析;採購動機明確,包含降低考務人力、提高流程可信度、支援混合題型,並讓考後資料回到教學改善與機構決策。

(一)、台灣可服務市場

第一階段的可服務市場,以高等教育、實驗教育、機構與檢定單位中的「可實際成交付費單位」作為估算核心。付費單位可以是一門課、一個系所、一個院級中心、一個協會,或是一個檢定專案;這樣的切入方式能讓產品先建立高品質導入案例,再逐步擴張到系所、院級或機構年約。

根據教育部統計,113 學年度台灣大專校院共有 140 所、學生數 1,074,365 人;高級中等學校共有 506 所、學生數約 549,843 人。這些公開母體用來確認需求存在,但早期估算採保守方式,只計入可透過既有場域、教授人脈、合作洽談與機構專案推進的成交單位。

客群 初期切入對象 第一年預估付費單位 第二年預估付費單位 主要購買形式
高等教育 NYCU 延伸課程、資訊 / 工程 / 商管 / 社科大班課程、系所或中心 6 至 10 個 12 至 20 個 單門課訂閱、學期方案、系所或中心共用
高中與實驗教育 實驗高中、重視素養題或實作評量的高中端單位 1 至 3 個 4 至 8 個 合作 pilot、學期方案、模擬考服務
機構與檢定單位 協會、研究機構、培訓單位、能力檢核或模擬考主辦單位 2 至 5 個 6 至 12 個 機構訂閱、年度方案、考試點數加購
合計 課程、系所、中心、協會與檢定專案 9 至 18 個 22 至 40 個 以正式考試導入案例累積續約與擴張

(二)、台灣現況與市占判讀

台灣線上正式考試市場正處在紙本流程、LMS 與專用考試系統並行的轉換期。現場需求主要分散在三種既有做法中:

  1. 學校既有 LMS 或教學平台處理線上測驗。
  2. 教師與助教用紙本、Google 表單、Excel、通訊軟體與人工批改拼接流程。
  3. 資訊或實作型課程會用程式作業平台處理上機題,但其他題型、正式監考流程與考後資料整理仍需另外處理。

QJudge 的早期市占目標,會以正式考試事件數、機構專案數與重複使用率來衡量。一所大學每學期有大量課程與正式測驗,只要先切入其中考務成本最高、最需要監考紀錄與混合題型支援的 10 至 20 個考試場景,就能形成可驗證的收入、案例與續約基礎。

(三)、競品分析

競品分析聚焦正式考務閉環,而不是單一的線上測驗功能。評估維度包含考前題目與考生管理、考中監考與紀錄、考後批改與資料整理,以及 AI 能否進入出題、批改與考後分析流程。

下表用功能矩陣整理本產品與常見替代方案的差異。綠色 代表主要功能完整支援,黃色 代表部分支援、需外掛或需人工補流程, 代表通常不是該類產品的主要能力。

重點功能 QJudge LMS / 表單 通用測驗平台 批改 / 作業平台
考試建立與考生名單管理
混合題型:選擇、填空、問答、實作題
考中監考事件與異常回溯
批改矩陣與教師複核
AI 出題、批改與考後整理
成績匯出與班級分析
題目、作答、監考與批改資料集中留存
台灣教育場域導入與客製報表
AI 協作型測驗 △ 規劃中

競品與替代方案可以分成幾類來看:

  • LMS / 表單:包含 TronClass、Moodle、Canvas、Google Classroom / Forms 等既有教學工具。適合發布教材、繳交作業與簡單測驗,但正式考試需要的監考紀錄、異常回溯、批改複核與考後分析仍需要大量人工補流程。
  • 通用測驗平台:包含 OnlineExamMaker、Quilgo、SurveyMonkey Online Quiz 等線上測驗產品。這類工具能快速建立測驗,也開始加入 AI 出題或監考功能,但多半以問卷或通用測驗為核心,較難直接承接台灣課堂中的混合題型、助教批改流程與校內導入情境。
  • 批改 / 作業平台:包含 Gradescope 或 LMS 內建作業批改模組。它們在作業批改與 rubric 管理上有優勢,但通常不處理完整的考前名單、考中監考、交卷狀態、事件紀錄與考後資料整合。
  • 核心競爭力:把題目建立、學生作答、監考紀錄、批改複核、成績整理與考後分析放在同一個受信任的系統中,並以台灣教育場域導入、混合題型支援與考後資料分析作為差異。

(四)、考務人力節省試算

QJudge 的人力節省效益,主要來自把批改、登分、成績匯出與考後資料整理等重複流程集中到同一平台。教師仍掌握評分標準與爭議題複核,助教則能把時間從重複行政工作轉回題目品質、學習回饋與例外處理。

以下以三個導入情境估算人力節省幅度。數字依既有場域、題型結構與作業流程推算,用來呈現導入後可回收的人力規模;實際效益仍會依題型、複核比例與考試規模調整。

試算場景 考試規模 傳統人工時間 導入後 預計節省
計算機概論上機考 65 人、5 場、每場 5 題實作題 約 270.8 小時 約 25 小時 約 90%
OS 作業系統混合題考試 130 人、3 場、平均每份考卷 0.5 小時 約 195 小時 約 39 小時 約 80%
機構型線上分科模擬考 350 人以內、8 場、28,000 題次開放題 約 495 小時 約 150 小時 約 70%

以 OS 課程為例,傳統批改下每場考試約需要 65 小時,若由 5 位助教分攤,每人仍要花約 13 小時;導入後,每場批改時間可降至約 13 小時,平均每位助教約 2.6 小時。教師與助教仍然掌握評量品質,但時間會集中在題目品質、爭議題複核與學生學習狀況判讀上。

對機構型考試而言,節省的人力更明顯。線上分科模擬考若包含 8 場考試與大量開放題,人工流程會把時間分散在監考、批改、登分與資料整理上。資料集中在同一個系統中,AI 批改、人工抽查、成績匯出與考後分析就可以接在同一條流程上完成。

六、商業模式:潛在導入單位、收費設計與成長路徑

目前已接觸的單位,可分為直接導入、推廣合作與創業支持三類。部分單位適合成為正式測驗或課程導入場域,部分單位則能協助 QJudge 接觸更多教師、學生與教育機構。這些合作尚未全部完成簽約,但都已經過實際洽談,並展現出對可信線上測驗、AI 批改與考後資料整理的需求或推廣意願。

(一)、已接觸的導入、推廣與支持單位

單位或場域 合作定位 需求情境或推廣切入 目前狀態
國立陽明交通大學課程場域 已完成導入場域 計算機概論、OS 作業系統等大班正式考試 已完成實戰使用,可整理為公開案例
台灣研究與實作協會 推廣合作與機構型試點 線上分科測驗公益模擬考、機構型能力檢測 已洽談並具推動意願
亞太研究院 推廣合作與機構導入 培訓、研究或能力檢核測驗 已洽談,評估首個落地場景
國立政治大學 課程與院級導入 社科大班、開放題與素養型評量 已洽談,評估課程或院級導入需求
竹北實驗高中 實驗高中場域 實驗性質高中,具線上測驗導入意願 已洽談,評估線上測驗導入條件
JUST AI 研發中心 AI 教育推廣合作 AI 教育活動、教師推廣與教育場域連結 已洽談合作推廣方向
桃源青年指揮部 / 桃源安東新創基地 創業支持與推廣資源 創業輔導、資源連結與對外推廣 已進駐基地
國立陽明交通大學 Logo
陽明交通大學
亞太綜合研究院 Logo
亞太研究院
國立政治大學 Logo
國立政治大學
竹北實驗高中 U-School Logo
竹北實驗高中
JUST AI 研發中心 Logo
JUST AI 研發中心
桃源青年指揮部與桃源安東新創基地 Logo
桃源青年指揮部 / 桃源安東新創基地

這些單位的共同點,是都不是只需要「線上作答」的工具,而是需要一套能支援正式測驗、推廣活動或教育場域導入的完整流程。QJudge 的商業模式因此不只對應單一軟體功能,而是對應考前題目整理、考中監考紀錄、考後批改、成績匯出與資料分析所帶來的整體考務價值。

(二)、收費設計

收費方式以月費訂閱制為主,搭配點數處理短期使用高峰。單一教師、小型課程或補習班可以從 Basic 開始;多門課、大班測驗或系所單位可升級到 Pro / Max;院級、中心級或機構客戶則採大型機構方案,納入導入規劃、權限設定、資料格式與必要整合服務。

方案 建議月費 每月考試數 每月 AI 點數 監考與紀錄 適合客戶
Basic NT$3,000 / 月 5 場 1,000 點 即時監控、事件紀錄 單一教師、小型補習班、實驗教育課程
Pro NT$12,000 / 月 30 場 8,000 點 即時監控、事件紀錄、考試錄像保存 大班課程、中型補習班、多門課共用
Max NT$25,000 / 月 80 場 25,000 點 即時監控、事件紀錄、考試錄像保存、Face ID 驗證 系所、中心、教育機構

若客戶超過方案內含額度,可額外購買點數。點數加購不作為獨立方案,而是訂閱客戶的超額使用機制,讓期中、期末、大型模擬考或跨班級使用時的短期高峰有清楚計價方式。

加購項目 單價 說明
線上施測點數 NT$5 / 人時 考生人數 × 考試小時數
AI 點數 NT$1 / 點 可用於 AI 批改或 AI 出題,降低計費理解成本

AI 批改與 AI 出題統一用 AI 點數計算,避免客戶需要理解 token 數量或不同 AI 功能的細項價格。Coding 判題作為平台能力納入方案,不另外拆成獨立收費項目。

(三)、大型機構方案

大型機構通常需要把考試系統放進既有校園或機構流程,因此報價除了使用量,也會納入帳號權限、資料格式、LMS 串接、SSO 身份認證、校務格式整合與教育訓練。這些項目不包進一般 Basic / Pro / Max 方案,而是作為機構導入與客製整合內容。

收費項目 建議價格 說明
大型機構月訂閱 NT$40,000 至 NT$120,000 / 月 依使用人數、考試場次、同時在線容量、AI 額度與服務等級報價
一次性技術導入與教育訓練 NT$50,000 至 NT$300,000 帳號規劃、權限設定、管理者教育訓練、教師操作說明、資料格式規劃
LMS 串接 / SSO 身份認證 / 校務格式整合 專案報價 僅提供給大型機構客戶,依整合範圍與技術複雜度報價
私有部署或專屬雲環境 專案報價 適用於資安要求較高、或需專屬環境的機構

(四)、成本與毛利估算

收入主要來自月費訂閱、超額點數加購,以及大型機構導入與客製整合。毛利計算先只看客戶使用平台時會直接增加的成本,例如雲端主機、資料庫、儲存、頻寬、AI token、平台運算、監控備份與基礎客服;工程、產品、行政與行銷則列為公司營運費用。

成本項目 估算方式 目前估算
線上施測流量 月施測人時 × 雲端 / DB / 頻寬成本 約 NT$0.2 / 人時
AI 點數使用 月 AI 點數 × 平均 token 成本 約 NT$0.2 / 點
平台運算資源 月施測、作答與程式執行所需運算 約 NT$0.1 / 人時
工程 / 產品人力 產品開發、維護、修 bug、功能迭代 約 NT$100,000 / 月
公司維持營運成本 工具、網域、行政、會計、基本雜支 約 NT$10,000 至 NT$20,000 / 月

以基準月估算,若月收入約 NT$175,000,平台直接成本約占 28%,則月毛利約 NT$126,000,毛利率約 72%。第一年在客戶數不足時可能接近損益兩平或小幅虧損;當月收入成長至約 NT$500,000 以上,固定人力與營運成本被攤薄,訂閱收入就能開始支撐公司獲利。

(五)、三年營收規劃

年度 Basic 訂閱收入 Pro 訂閱收入 Max / 大型機構訂閱收入 點數加購收入 年營收目標
第 1 年 NT$30 萬 NT$100 萬 NT$60 萬 NT$10 萬 NT$200 萬
第 2 年 NT$50 萬 NT$260 萬 NT$230 萬 NT$60 萬 NT$600 萬
第 3 年 NT$80 萬 NT$500 萬 NT$720 萬 NT$200 萬 NT$1,500 萬

第 1 年重點是建立可公開案例與首批付費客戶;第 2 年提高 Pro、Max 與機構方案收入占比;第 3 年擴大型機構訂閱與續約收入。若以工程 / 產品人力 NT$100,000 / 月、公司維持營運成本 NT$15,000 / 月估算,第 1 年仍可能小幅虧損,第 2 年起有機會轉正。

(六)、市場導入策略

初期導入不以全校性採購或大型標案為優先,而是先透過交大碩博士與教授人脈,讓更多老師在不同課堂中實際使用。每一次導入都同步收集教師、助教與學生回饋,修正題型支援、監考流程、批改介面與報表輸出。當課堂使用能被重複複製,再往系所、院級、中心級與機構合作推進。

未來 12 個月的重點,是把已驗證課程案例整理成導入模板,接著推進具付費意願的機構試點,再形成可重複銷售的學期方案或機構訂閱。

時程 推進重點 行動 指標
0-2 個月 課堂導入深化 整理計概與 OS 導入流程,建立測前檢查、監考 SOP、批改與匯出模板 導入流程文件完成;2 個課程案例
2-6 個月 付費試點 推進台灣研究與實作協會分科測驗公益模擬考,接觸 1-2 個具付費意願機構 1 個機構型試點;首批付費或準付費案例
6-12 個月 機構擴張 推進亞太研究院、國立政治大學等合作機會 3 個系所、院級、中心級或教育機構合作
12 個月後 產品化交付 固化導入設定、報表模板與監考流程,銜接學期方案、機構方案與點數制 20 場以上正式考試或模擬考;可重複銷售流程

七、團隊執行能力與公司願景:從教學現場到產品化

(一)、從教學現場走向產品實作

QJudge 目前是一人公司,由我個人主導推進產品開發、介面設計、考務流程規劃、場域導入、商業驗證與對外合作。這種工作型態需要的不只是工程能力,而是能同時理解教育現場、系統開發、使用者溝通與專案交付。過去在校內資訊技術服務中心參與系統開發,讓我有能力處理平台架構、權限、穩定性與校園系統情境;多元課程助教經驗,讓我熟悉教師、助教與學生在考務流程中的實際壓力;IBM Taiwan 實習與 AI Agent 產品經驗,則補上需求釐清、客戶溝通、AI 工具導入與交付節奏。再加上生成式 AI 工具放大了一人團隊的開發量能,使我能用較小團隊規模完成原型、文件、流程驗證與產品迭代。

這個題目不是只來自單一資訊課程,而是長期在不同教學現場看到同一類問題:老師想設計更好的評量,助教需要處理大量行政與批改工作,學生則需要更清楚、公平、可信的作答與回饋流程。不同課程的題型、學生背景與評量方式不同,但最後都會回到出題、作答、監考、批改、登分與回饋之間的流程斷裂。

因此,QJudge 現階段雖然以一人公司形態推進,但不是孤立開發。產品背後有桃源青年指揮部與桃源安東新創基地的支持,也持續透過校園、創業基地與教育場域資源接觸潛在合作機會。這些外部資源能補足早期團隊規模有限的問題,讓產品在開發之外,同步累積場域、合作與商業驗證基礎。

(二)、多元助教經驗

在產品開發之外,我也長期投入不同類型的教學現場。這些助教經驗橫跨語言、通識、資訊服務、大一基礎課程與研究所技術課程,讓我熟悉課程執行、教材準備、學生互動與考務支援的實際細節。下表整理主要助教經驗與負責內容:

助教經驗 年限 主要負責內容與教學經驗
大一英文助教 1 年 帶領英文口說與寫作課程,協助學生練習表達、修訂文章,並製作與設計課堂相關教材。
大一資訊服務課程助教 2 年 協助大一學生熟悉校園資訊服務與數位工具,理解新生在帳號、系統操作、權限與流程上的學習成本。
通識課程 AI 人工智慧專題助教 1 年 協助通識課程教學與課堂活動,支援學生理解 AI 基礎概念、工具使用與專題討論。
碩班計算機網路助教 2 年 協助作業、實作與課程內容討論,支援學生理解網路協定、系統設計與實作細節。
OS 作業系統助教 2 年 協助 OS 課程作業與考試,處理題目說明、學生問題、考後批改、登分與複核。
大一計算機概論助教 1 年 協助大一程式與計算機基礎課程,支援上機練習、考試流程與學生實作問題處理。

這些經驗讓我不是只從工程角度看教育產品,而是能理解課程現場中教師、助教與學生各自承受的壓力。QJudge 的產品判斷,也建立在這些實際教學與考務經驗之上。

(三)、經歷與能力累積

經歷 累積能力
多元課程助教與考務現場 累積課堂帶領、學生溝通、教材準備、作業協助與考務支援經驗,熟悉不同課程現場的實際運作。
校園系統開發 參與校級 SSO Portal、舊系統重構、UI 改版與雙因素驗證建置,累積大型校園系統的開發、維護、權限控管與穩定性經驗。
IBM Taiwan 實習與企業專案 接觸企業級需求訪談、系統開發、客戶溝通與交付流程,理解正式專案中需求釐清、進度管理與品質要求。
AI Agent 產品經驗 曾協助中小企業導入 AI Agent 客服,累積需求拆解、流程設計、AI 工具導入與實際營運場景調整經驗。
領導獎學金與競賽經驗 大學期間獲聯發科董事長蔡力行頒發的蔡力行傑出領導獎學金,也曾參與多項技術競賽,累積跨團隊協作、專案推進與短時間完成可展示成果的能力。

整體而言,這些經歷讓我同時具備教學現場理解、系統開發、企業需求溝通、AI 導入與專案推進能力。它們不需要每一項都直接對應到 QJudge,但共同構成我推動教育科技產品與正式線上考試平台的能力基礎。

IBM Taiwan 實習經歷
IBM Taiwan 實習經歷:累積企業級系統開發、需求理解與客戶交付經驗。
大學傑出領導獎學金經歷
蔡力行傑出領導獎學金:由聯發科董事長蔡力行頒發,累積跨團隊協作與專案推進經驗。
2026 TSMC IT CareerHack 分組第一名
台積電黑客松(2026 TSMC IT CareerHack):以 AI 舊程式碼智能重構題目獲得分組第一名,佐證技術實作與競賽交付能力。

(四)、我的期待與教育想像

我真正想推動的,不只是線上考試,而是更長遠的翻轉教育。我並不喜歡台灣教育長期依賴填鴨式測驗,也不認為更多考試本身就是答案。只是如果沒有一個穩定、可信、老師願意採用的平台,許多新的評量想像很難進入真實課堂。傳統紙筆測驗是教育現場最熟悉的起點,所以我必須先做出一套讓大家願意嘗試的線上測驗平台,讓老師與學生先跨過從紙本到數位的第一步。

當這一步被完成後,測驗就不必只停留在選擇題、填空題或標準答案。未來的評量可以更靈活:學生可以在 AI 競技場中解決問題,可以和 AI 考官進行一對一問答,也可以與 AI 協作完成一份作品、報告、分析或實作任務,再把過程與成果一起提交。這些想像的重點不是炫耀技術,而是讓評量重新回到能力本身,讓學生被看見的不只是記憶了多少內容,而是能不能理解問題、組織資訊、做出判斷並完成真實任務。

QJudge 對我而言,是一個從現實出發、但不想被現實限制住的教育科技品牌。它可以先承接老師最熟悉的正式測驗流程,讓考務更可信、更有效率;但它最後應該走向更開放的學習與評量方式,讓老師有空間設計更好的題目,讓學生有機會展現更完整的能力。

我希望這套平台能從台灣的教學現場開始,被大學、補教、技職與實作型課程驗證,再慢慢走向東南亞與亞洲其他正在進行教育數位轉型的市場。我的期待不是把台灣既有的考試文化原封不動搬到線上,而是先建立一座橋,讓更多教育者願意從熟悉的紙筆測驗出發,逐步走向更公平、更彈性、更能面向未來的評量方式。

讓正式測驗更簡單、更可信,並把考後資料轉成教師能使用的依據。

QJudge · 下世代的數位學習體驗