聯發創新基地一口氣釋出2款繁中多模態語言模型、1款臺灣語音合成模型,他們揭露幾個技術關鍵,像是採用LLaVA架構增添多模態能力、使用低學習率以保留基礎模型優點、建置大量繁中資料集,以及透過Decision Token來增強模型呼叫函式的判斷力、用G2PW來準確判斷讀音等。