← Blog

Suikou AI में आपका स्वागत है — जापानी-मजबूत वैश्विक ह्यूमनाइज़र

हमने Suikou AI क्यों बनाया, तीन-पास ह्यूमनाइज़ + Qwen-72B डिटेक्टर पाइपलाइन कैसे काम करती है, और जापानी / कोरियाई रूपविज्ञान हमें प्रतिस्पर्धात्मक लाभ कहाँ देता है।

·1 min read·Ryota Nishiyama

यह Suikou AI ब्लॉग की पहली पोस्ट है। यह इस बात की पुष्टि करने के लिए है कि MDX कंटेंट पाइपलाइन एंड-टू-एंड रेंडर होती है — frontmatter पार्सिंग, विषय सूची, पढ़ने के समय का अनुमान, और Article JSON-LD सभी इस एकल फ़ाइल से चलते हैं।

Suikou AI क्यों

अधिकांश AI ह्यूमनाइज़र अंग्रेज़ी के लिए बनाए गए थे। जब आप एक जापानी अकादमिक ड्राफ्ट उनमें पेस्ट करते हैं, तो आपको अंग्रेज़ी के आकार की जापानी वापस मिलती है: एकरस वाक्य अंत, टूटा हुआ は / が प्रत्यावर्तन, कान्जी-अनुपात जो मशीन को चीखता है। हमने Suikou AI इसलिए बनाया क्योंकि जापानी का रूपविज्ञान ह्यूमनाइज़र को एक ऐसा काम देता है जिसे अंग्रेज़ी-बहुल कॉर्पोरा पर प्रशिक्षित LLM बार-बार बिगाड़ते हैं — और क्योंकि वह काम जापानी में अच्छी तरह से करना, कोरियाई और पारंपरिक चीनी में भी वही काम है, जहाँ वही अंतर मौजूद है।

पाइपलाइन कैसे काम करती है

  1. तीन समानांतर पुनर्लेखन DeepSeek-Chat के माध्यम से 0.6 / 0.8 / 1.0 तापमान पर।
  2. AI-संभावना स्कोरिंग Qwen-72B (OpenRouter के माध्यम से) के साथ जापानी-रूपविज्ञान-सचेत रूब्रिक के तहत प्रत्येक उम्मीदवार की।
  3. सबसे कम AI-स्कोर उम्मीदवार जीतता है। Pro उपयोगकर्ता claude-3.5-haiku के माध्यम से एक दूसरे-पास अकादमिक पॉलिश में opt in कर सकते हैं जो [CITE:1] शैली के उद्धरण मार्करों को सुरक्षित रखता है।

आगे क्या है

यह ब्लॉग इंजीनियरिंग ट्रेडऑफ़ (DeepSeek क्यों और GPT-4 क्यों नहीं, डिटेक्टर के लिए Qwen-72B क्यों, पॉलिश पास में उद्धरण बहाव का पता कैसे लगाएँ) और संचालन ट्रेडऑफ़ (एक-व्यक्ति dev, छिपी HK संस्था, हम अभी टीम योजनाएँ क्यों नहीं करते) को दस्तावेज़ करेगा। यदि आपको Suikou AI उपयोगी लगा, तो सबसे अच्छी बात जो आप कर सकते हैं वह है किसी एक और स्नातक छात्र को इसके बारे में बताना।

— Ryota