Anonim

Windows 10 Insider Preview Build 18875 (20H1)

في الحلقة التاسعة من الموسم الثاني من Log Horizon عندما ...

مات Shiroe وظهر على الخادم الرابع عشر غير الرسمي لـ Elder Tale ، خادم الاختبار ، الذي تم تعيينه ليكون على القمر بدلاً من الأرض ،

... قام بفحص الموقع وكان الحوار مشوهًا في الغالب ، وتم حفظه لاسم الموقع ماري ترانكويليتاتيس.

هل يمكن فك تشفير النص المشوه ، أم أنه مجرد تافه؟

نعم ، النص المشوه هو نتيجة mojibake ، حيث يتم فك تشفير النص الأصلي باللغة اليابانية ، المشفر بترميز Shift-JIS ، بواسطة ترميز Windows-1256.

إذا فتحت في أي وقت صفحة ويب يابانية أو ملفًا نصيًا مشفرًا في ترميز Shift-JIS (مجموعة أحرف ثنائية البايت) ضمن بعض الترميز الغربي في Windows (مجموعة أحرف 1 بايت) ، فسترى ترددًا عاليًا لـ �� مقترنًا ببعض الشخصيات الأخرى في العرض الناتج. نظرًا لأنني لاحظت وجود أحرف عربية في الصورة ، فقد استخدمت أحد ملفاتي النصية الموجودة والتي تم ترميزها في Shift-JIS وحاولت فتحه بترميز باللغة العربية (Windows) في المتصفح ، واكتشفت أن اللغة العربية (Windows) أو الترميز الغربي نفس التعيين لـ �� و �� (وهي شخصية شائعة أخرى في النص المشوه).

بعد المقارنة مع نافذة حالة الموقع التي تم عرضها بشكل صحيح وبعض التخمينات ، تمكنت من فك تشفير النص المشوه إلى نص ياباني مناسب (تمت إضافة الأقواس و من أجل الوضوح ولم يتم فك تشفيرها من نص مشوه):

������������������ ��������������� ��������������� ��������������� ������������ ���������������/��������������������������� ��������������� ������������������������ ������������������������ ���������������/������������ ���������������/������������ 

ترجمة:

 Moon Server  Moon Server  Isolated zone/No monster  PVP allowed Special skills allowed Entry restriction/Restricted Exit restriction/Restricted 

الملحق

للتحقق من النتيجة ، يمكنك استخدام الجزء التالي من كود Python 3:

garbled = '��T��[��o��[\n������T��[��o��[\n��]��[�����\n������T��[��o��[\n����������\n�����������]��[�����/������������X��^��[��o��������������\n���������������\n�����������s������������\\���������\n��@���S��������Z��g���p��������\\\n��@��i����������������/�����������\xa0�����\n��@�������o�����������/�����������\xa0�����' print(garbled.encode('Windows-1256').decode('Shift-JIS')) 

أدناه هو للاطلاع فقط مصدر1 من mojibake للمقارنة مع الصورة:

1 يحتوي النص أدناه على علامة U + 200E من اليسار إلى اليمين لمنع الأحرف العربية من العرض من اليمين إلى اليسار وتغيير أشكالها بناءً على موضعها. هناك مشكلة أخرى تمنع النسخ المستقيم وهي بسبب وجود U + 00A0 No-Break Space ، والتي يتم تحويلها إلى مساحة عند نسخها من المتصفح.

�����T��������[��������o��������[��� ���������������T��������[��������o��������[��� �����]��������[�������������� ���������������T��������[��������o��������[��� ���������������������� ��������������������������]��������[��������������/������������������������������X��������^��������[��������o����������������������������������� ��������������������������������� ��������������������������s������������������������������\������������������������ �����@���������S��������������������Z��������g���������p��������������������\��� �����@��������i�������������������������������������/��������������������������������������������� �����@�������������������o��������������������������/��������������������������������������������� 
1
  • "حماية الأصناف النباتية مسموح بها": هاه. أتساءل ما إذا كان هذا سينتهي به الأمر مهمًا.