นี่คือโพสต์แรกบนบล็อก Suikou AI โพสต์นี้มีไว้เพื่อยืนยันว่า pipeline เนื้อหา MDX ทำงานแบบ end-to-end ได้อย่างถูกต้อง — การแยกวิเคราะห์ frontmatter สารบัญ การประมาณเวลาอ่าน และ Article JSON-LD ทั้งหมดทำงานจากไฟล์เดียวนี้
ทำไมถึงสร้าง Suikou AI
AI humanizer ส่วนใหญ่ถูกสร้างสำหรับภาษาอังกฤษ เมื่อคุณวางร่างวิชาการภาษาญี่ปุ่น
เข้าไป คุณได้ภาษาญี่ปุ่นที่มีรูปแบบภาษาอังกฤษ: การลงท้ายประโยคแบบเดียว
การสลับ は / が ที่ผิดพลาด สัดส่วนคันจิที่บ่งบอกความเป็นเครื่อง เราสร้าง Suikou AI
เพราะสัณฐานวิทยาของภาษาญี่ปุ่นให้งานแก่ humanizer ที่ LLM ที่ฝึกบน
corpus ที่ส่วนใหญ่เป็นภาษาอังกฤษยังคงทำพลาดอยู่เรื่อยๆ — และเพราะ
การทำงานนั้นให้ดีในภาษาญี่ปุ่นคืองานเดียวกันในภาษาเกาหลีและจีนดั้งเดิม
ที่ช่องว่างเดิมมีอยู่
วิธีการทำงานของ Pipeline
- การเขียนใหม่คู่ขนานสามแบบ ที่อุณหภูมิ 0.6 / 0.8 / 1.0 ผ่าน DeepSeek-Chat
- การให้คะแนนความน่าจะเป็น AI ของตัวเลือกทุกตัวด้วย Qwen-72B (ผ่าน OpenRouter) ภายใต้เกณฑ์ที่รับรู้สัณฐานวิทยาภาษาญี่ปุ่น
- ตัวเลือกที่มีคะแนน AI ต่ำที่สุดชนะ ผู้ใช้ Pro สามารถเลือกใช้
การขัดเกลาวิชาการรอบสองผ่าน claude-3.5-haiku ที่รักษา
เครื่องหมายการอ้างอิงแบบ
[CITE:1]
ขั้นตอนต่อไป
บล็อกนี้จะบันทึกการแลกเปลี่ยนทางวิศวกรรม (ทำไมถึงใช้ DeepSeek ไม่ใช่ GPT-4, ทำไม Qwen-72B สำหรับเครื่องตรวจจับ วิธีตรวจจับการเปลี่ยนแปลงการอ้างอิงในการขัดเกลา) และการแลกเปลี่ยนในการดำเนินการ (การพัฒนาคนเดียว นิติบุคคล HK ที่ซ่อนอยู่ ทำไม ถึงยังไม่ทำแผนทีม) หากคุณพบว่า Suikou AI มีประโยชน์ สิ่งที่ดีที่สุดที่คุณทำได้ คือบอกนักศึกษาระดับบัณฑิตอีกคนหนึ่ง
— Ryota
