Questo è il primo post del blog di Suikou AI. Esiste per verificare che la pipeline dei contenuti MDX funzioni end-to-end — parsing del frontmatter, indice dei contenuti, stima del tempo di lettura e il JSON-LD Article girano tutti da questo singolo file.
Perché Suikou AI
La maggior parte degli humanizer AI è stata costruita per l'inglese. Quando incolli una bozza
accademica in giapponese, ottieni indietro un giapponese con la forma dell'inglese: desinenze
delle frasi monotone, alternanza は / が interrotta, proporzione di kanji che grida macchina. Abbiamo
costruito Suikou AI perché la morfologia del giapponese dà agli humanizer un compito che i modelli
LLM addestrati su corpora a maggioranza inglese continuano a sbagliare — e perché fare bene
quel lavoro in giapponese è lo stesso lavoro in coreano e cinese tradizionale, dove esiste
lo stesso divario.
Come funziona la pipeline
- Tre riscritture parallele a temperature 0,6 / 0,8 / 1,0 tramite DeepSeek-Chat.
- Punteggio di probabilità AI di ogni candidato con Qwen-72B (via OpenRouter) secondo un rubric consapevole della morfologia giapponese.
- Il candidato con il punteggio AI più basso vince. Gli utenti Pro possono optare per un
secondo passaggio di rifinitura accademica via claude-3.5-haiku che preserva
i marcatori di citazione in stile
[CITE:1].
Cosa viene dopo
Questo blog documenterà i compromessi ingegneristici (perché DeepSeek e non GPT-4, perché Qwen-72B per il rilevatore, come rilevare la deriva delle citazioni in un passaggio di rifinitura) e i compromessi operativi (sviluppo da una persona, entità HK nascosta, perché non facciamo ancora piani team). Se hai trovato Suikou AI utile, la cosa migliore che puoi fare è dirlo a un altro dottorando.
— Ryota
