الحروف الأكثر شيوعا في اللغة الروسية. تكرار استخدام الحروف باللغة الروسية

بشكل عام، هناك مثل هذا الموضوع - تحليل تردد النص. يقال أنه بالنسبة للغة معينة، فإن تكرار ظهور الحروف الفردية في نص ذي معنى يعد قيمة ثابتة. مجموعات من اثنين وثلاثة (Digrams، Trigrams) وأربعة أحرف مستقرة أيضًا.
هذه الحقيقة، على وجه الخصوص، تم استخدامها في التشفير لكسر الأصفار.

أنا لست جيدًا في التشفير، والشيء الوحيد الذي يتبادر إلى ذهني هو كسر تشفير الاستبدال المباشر. ويجب القول أن التشفير الأكثر بدائية هو عندما يتم تحويل أحرف الأبجدية الأصلية المستخدمة في الرسالة إلى أحرف أخرى وفقًا لقاعدة معينة. بالمناسبة، يمكن فتح هذه الأصفار دون استخدام التحليل الإحصائي(حيث، للحد من الخطأ، من الواضح أن وجود أجزاء كبيرة إلى حد ما من النص مطلوب)، ولكن ببساطة عن طريق تخمين بعض الكلمات - راجع قصة "الرجال الراقصون".

واللمسة النهائية (اختيارية). في بعض الأحيان (دائمًا تقريبًا) تحتاج الآلة الحاسبة إلى تزويدها بوصف - ما هي المعلمات، وما هي الصيغ التي تستخدمها، وبشكل عام، سبب كل ذلك - تمامًا كما أفعل الآن. للقيام بذلك، يتم كتابة مقال، ويتم إدراج الآلة الحاسبة مباشرة في المقالة. لكتابة مقال، حدد عنصر القائمة "إنشاء..." -> "مقالة" في الصفحة الرئيسية لقسم "الحاسبات الخاصة بي" وابدأ في الكتابة. لإدراج آلة حاسبة، اضغط على الزر الذي يحمل الحرف A الكبير الذي تحته خط وحدد الآلة الحاسبة التي تم إنشاؤها حديثًا في مربع الحوار الذي يفتح.

يمكن تسمية الحرف الأكثر شيوعًا في الأبجدية الروسية بأمان بـ "o". ليس "أ"، على الرغم من أن جميع الأطفال يتعلمون كلماتهم الأولى بهذا الحرف: "أمي"، أو "أبي"، أو "أعط". ليست "و"، على الرغم من أنه قد يبدو أننا غالبًا ما نستخدمها كأداة ربط.

وكما تظهر البيانات، فإن حرف "o" هو الذي يزيد تردده عن 0.1%، مقارنة بأحرف العلة الأخرى من الأبجدية، والتي يكون ترددها مثلا 0.07-0.08%، وهي نسبة كبيرة جدا.

من بين الحروف الساكنة، الحرف "ن" يأتي أولا.

يتم الحصول على هذه البيانات من خلال تحليل التردد في NCRY - المجموعة الوطنية للغة الروسية، باستخدام صيغة خاصة. NKRY هو أرشيف إلكتروني للنصوص المكتوبة والمنطوقة، والذي يتكون من حوالي 230 مليون كلمة مستخدمة.

بالنظر إلى الحرف الأكثر شعبية في أبجديتنا، تجدر الإشارة إلى ظاهرة مثيرة للاهتمام تسمى "tautogram". يعد هذا نوعًا من الإحماء الأدبي حيث تحتاج إلى تأليف قصة أو قصيدة تبدأ بالحرف نفسه. بالمناسبة، فإن الحرف الذي تبدأ به معظم الكلمات في اللغة الروسية (لا تخلط بينه وبين تكرار الاستخدام) هو "p"، ولكن من بين حروف العلة، تنتمي القيادة التي لا شك فيها إلى مفضلتنا الحالية.

"وحيد. جداً. سقطت شظايا السحر في رتابة الخريف. وظل أوليمبوس منفذا بعيدا. بعيد جدًا. ظلت الاستياء، والتعريفات المتهورة للذوبان المذاب، الناجم عن نار اللمس. وتبين أن الباقي سلبي ومرفوض ومخدوع من قبل المجتمع. تعثر نسل الخريف وحلّق مع بقايا عيون البحيرة. ظلت بعض النوافذ مفتوحة. إن البصمات الغاضبة للمتجانسات الفردية طغت عليها أردية التجسيد المرفوضة. يتم تحديد الظلال البرتقالية لنبق البحر من خلال انعكاس كبير للوحدة. والباقي هو التعظم، وخدر الهلاك. الجزر مليئة بالوعود من المقالات عن اليقين. شكلت قصاصات ألدر المبردة دوائر تحمل نفس الاسم بسبب صرخات أجش. تحول المسؤول إلى انعكاس للجنرال، ويلغي اليقينيات السلبية. الصور المستقرة فسرت باستياء هراء الخريف، واصفة العكس بالخداع. لقد رسم الشباب بيأس الخريف المسحور، منكرين الموقف الموضوعي... طار الخريف مثل شظايا برتقالية من نبق البحر، تاركًا الخلافات المتعبة إلى إجابات وحيدة..."

إنه مضحك، أليس كذلك؟ إنه ليس هراء بعد كل شيء :)

بالمناسبة، الحرف الأكثر شيوعًا في اللغة الإنجليزية هو "e" والحرف الساكن هو "t".

حسنًا ، والرسم البياني باللغة الإنجليزية:

تحركات مريم المهيبة التي تشبه مينيرفا.

القانون، اللاتينية، الحرية، تعلمت لوسي الحب.

أناقة إليزا تراها كل عين.

مفاجأة ابتسامات سوزان الصامتة بهدوء.

من المتطفلين، الحمقى، الإطراء، أعدل ذباب فاني.

من المعروف أن تخطيط الحروف على لوحة المفاتيح في المطبعة أو الكمبيوتر الشخصي لا يتم تكوينه بشكل عشوائي، ولكنه يخضع لقواعد معينة. وبالتالي، فإن الحروف الأكثر استخدامًا توجد في الجزء المركزي من لوحة المفاتيح، أما الحروف الأقل شيوعًا فتوجد عند الحواف. ومن المعروف أيضًا أن حروف العلة تستخدم أكثر من الحروف الساكنة. تم الحصول على هذه المعلومات باستخدام صيغة خاصة في المجموعة الوطنية للغة الروسية.

حروف العلة الأكثر شيوعا

ومن الغريب أن الحرف "o" هو الرائد في عدد الاستخدامات في الكلام المكتوب، سواء بين حروف العلة أو بين الحروف الساكنة. ويتبعها "أ" و"و"، وبعد ذلك تبدأ الحروف الساكنة. وبحسب الخبراء، فإن تكرار استخدام حرف "o" هو عُشر بالمائة، بينما يتراوح تكرار حروف العلة الأخرى من سبعة إلى ثمانية أجزاء من المائة من المائة.

الحروف الساكنة الأكثر شعبية

الحرف الساكن الأكثر استخدامًا هو "n". علاوة على ذلك، فإن أكبر عدد من الكلمات في اللغة الروسية يبدأ بالحرف "p". من بين حروف العلة، "o" هو الرائد في هذا الصدد.

أندر الحروف الساكنة في الكلام الروسي هو الحرف "f" الذي يستخدم في الكلمات التي تأتي منها اللغات الأجنبية، وكذلك المحاكاة الصوتية، مثل "الشخير".

يمكن أن تكون هذه الإحصائيات مفيدة عند تجميع الرسوم البيانية. الهدف من لعبة الكلمات هذه هو إنشاء قصة متماسكة، حيث يجب أن تبدأ كل كلمة بالحرف نفسه.

في هذه المقالة سنبدأ المناقشة للغاية موضوع مثير للاهتمام- تطبيق الإحصائيات لتحليل المعلومات النصية. لاحظ أن استخدام الإحصائيات لتحليل النص يعد مهمة تقليدية.

أولا سوف نعطي بعض حقائق مثيرة للاهتمامبخصوص تكرار ظهور الحروف ومجموعاتها في اللغات المختلفة (لمزيد من التفاصيل راجع الكتاب). سنوضح في المقالات اللاحقة كيفية تطبيق طرق أكثر تعقيدًا للتحليل والتمثيل الرسومي.

خصائص تردد الرسائل النصية

إذن، النص يتكون من كلمات، كلمات من الحروف. عدد الحروف المختلفة في كل لغة محدود ويمكن ببساطة إدراج الحروف. الخصائص المهمة للنص هي تكرار الحروف وأزواج الحروف (الرسومات) وبشكل عام م-نعم ( م-gram)، توافق الحروف مع بعضها البعض، وتناوب حروف العلة والحروف الساكنة وبعض الآخرين. ومن اللافت للنظر أن هذه الخصائص مستقرة تمامًا. ونترك سؤال "لماذا" وراء الكواليس.

استخدام النظام إحصائياتيمكنك التحقق من هذه الأنماط، على سبيل المثال، في نصوص الإنترنت.

الفكرة هي حساب عدد مرات حدوث كل منها ن مممكن م-gram في نصوص واضحة طويلة بما فيه الكفاية ت=ر 1 ر 2 ... ر لمكونة من حروف الهجاء ( أ 1، أ 2، ...، ن). وفي نفس الوقت متتالية م-جرام النص:

ر 1 ر 2 ... ر م , ر 2 ر 3 ... ر م+1 , ..., ر أنا-م+1 ر-م+2 ...ر ل.

إذا - عدد التكرارات م-جرام أ i1 أ i2 ... أ ايمفي النص ت، أ ل- العدد الإجمالي للمحسوبين م-gram، ثم تظهر التجربة أنه كبير بما فيه الكفاية لالترددات

لهذا م-غرامات تختلف قليلا عن بعضها البعض.

ولهذا السبب، يعتبر التكرار النسبي (1) بمثابة تقريب للاحتمال ص (أ i1 أ i2 ... أ ايم) ظهور هذا م-جرامات في مكان تم اختياره عشوائيا من النص (يعتمد هذا المنهج في التحديد الإحصائي للاحتمالية).

فيما يلي جداول ترددات الحروف (بالنسبة المئوية) لعدد من اللغات الأوروبية. البيانات مأخوذة من الكتاب.

حرف الأبجدية فرنسي الألمانية اللغة الإنجليزية الأسبانية ايطالي
أ 7.68 5.52 7.96 12.90 11.12
ب 0.80 1.56 1.60 1.03 1.07
ج 3.32 2.94 2.84 4.42 4.11
د 3.60 4.91 4.01 4.67 3.54
ه 17.76 19.18 12.86 14.15 11.63
ف 1.06 1.96 2.62 0.70 1.15
ز 1.10 3.60 1.99 1.00 1.73
ح 0.64 5.02 5.39 0.91 0.83
أنا 7.23 8.21 7.77 7.01 12.04
ج 0.19 0.16 0.16 0.24 -
ك - 1.33 0.41 - -
ل 5.89 3.48 3.51 5.52 5.95
م 2.72 1.69 2.43 2.55 2.65
ن 7.61 10.20 7.51 6.20 7.68
يا 5.34 2.14 6.62 8.84 8.92
ص 3.24 0.54 1.81 3.26 2.66
س 1.34 0.01 0.17 1.55 0.48
ر 6.81 7.01 6.83 6.95 6.56
س 8.23 7.07 6.62 7.64 4.81
ت 7.30 5.86 9.72 4.36 7.07
ش 6.05 4.22 2.48 4.00 3.09
V 1.27 0.84 1.15 0.67 1.67
دبليو - 1.38 1.80 - -
X 0.54 - 0.17 0.07 -
ي 0.21 - 1.52 1.05 -
ز 0.07 1.17 0.05 0.31 1.24

يتم تفسير بعض الاختلاف في قيم التكرار في الجداول الواردة في مصادر مختلفة من خلال حقيقة أن التكرارات تعتمد بشكل كبير ليس فقط على طول النص، ولكن أيضًا على طبيعته. على سبيل المثال، في النصوص التقنية الرسالة النادرة فيمكن أن تصبح شائعة جدًا بسبب الاستخدام المتكرر لكلمات مثل الوظيفة، والتفاضل، والانتشار، والمعامل، وما إلى ذلك.

ولوحظ في البعض انحرافات أكبر عن القاعدة في تكرار استخدام الحروف الفردية أعمال فنية، وخاصة في الشعر. لذلك، لتحديد متوسط ​​\u200b\u200bتكرار الحروف بشكل موثوق، من المستحسن أن يكون لديك مجموعة من النصوص المختلفة المستعارة من مصادر مختلفة. ومع ذلك، كقاعدة عامة، هذه الانحرافات غير ذات أهمية، ويمكن إهمالها للوهلة الأولى.

يتم إعطاء تمثيل مرئي لترددات الحروف من خلال مخطط الحدوث. لذلك، بالنسبة للغة الإنجليزية، وفقا للجدول، يظهر هذا المخطط في الشكل. 1. لإنشائه، استخدمنا النظام إحصائيات.

بالنسبة للغة الروسية، ترددات (بالترتيب التنازلي) لأحرف الأبجدية التي تم تحديدها بها هج يو, بمع كوميرسانت، كما توجد علامة مسافة (-) بين الكلمات، موضحة في الجدول التالي (انظر).

-
0.175
عن
0.090
ها
0.072
أ
0.062
و
0.062
ت
0.053
ن
0.053
مع
0.045
ر
0.040
في
0.038
ل
0.035
ل
0.028
م
0.026
د
0.025
ص
0.023
ش
0.021
أنا
0.018
ي
0.016
ز
0.016
ب، ب
0.014
ب
0.014
ز
0.013
ح
0.012
ي
0.010
X
0.009
و
0.007
يو
0.006
ش
0.006
ج
0.004
SCH
0.003
ه
0.003
ف
0.002

وبناء على الجدول نحصل على مخطط التردد التالي (الشكل 2).

هناك قاعدة ذاكرية لحفظ الأحرف العشرة الأكثر شيوعًا في الأبجدية الروسية. هذه الحروف تشكل الكلمة السخيفة HAY. يمكنك أيضًا اقتراح طريقة مشابهة لحفظ الحروف الشائعة في اللغة الإنجليزية، على سبيل المثال، استخدام كلمة TETRIS-HONDA (انظر الجدول).

كما أن خصائص التردد للرموز الكبيرة والثلاثية والأربعة غرامات للنصوص ذات المعنى مستقرة أيضًا.

فيما يلي جداول ترددات بيجرام للغة الروسية و اللغات الانجليزية(الجداول مستعارة من الكتاب). للراحة، يتم تقسيمها إلى أربعة أجزاء وفقا للمخطط التالي:

الجزء 1 الجزء2
الجزء 3 الجزء 4

الجزء 1

أ ب في ز د ه و ز و ي ل ل م ن عن ص
أ 2 12 35 8 14 7 6 15 7 7 19 27 19 45 5 11
ب 5 9 1 6 6 2 21
في 35 1 5 3 3 32 2 17 7 10 3 9 58 6
ز 7 3 3 5 1 5 1 50
د 25 3 1 1 29 1 1 13 1 5 1 13 22 3
ه 2 9 18 11 27 7 5 10 6 15 13 35 24 63 7 16
و 5 1 6 12 5 6
ز 35 1 7 1 5 3 4 2 1 2 9 9 1
و 4 6 22 5 10 21 2 23 19 11 19 21 20 32 8 13
ي 1 1 4 1 3 1 2 4 5 1 2 7 9 7
ل 24 1 4 1 4 1 1 26 1 4 1 2 66 2
ل 25 1 1 1 1 33 2 1 36 1 2 1 8 30 2
م 18 2 4 1 1 21 1 2 23 3 1 3 7 19 5
ن 54 1 2 3 3 34 58 3 1 24 67 2
عن 1 28 84 32 47 15 7 18 12 29 19 41 38 30 9 18
ص 7 15 4 9 1 46

الجزء 2

ر مع ت ش ف X ج ح ش SCH ي ب ه يو أنا
أ 26 31 27 3 1 10 6 7 10 1 2 6 9
ب 8 1 6 1 11 2
في 6 19 6 7 1 1 2 4 1 18 1 2 3
ز 7 2
د 6 8 1 10 1 1 1 5 1 1
ه 39 37 33 3 1 8 3 7 3 3 1 1 2
و 1
ز 3 1 2 4 4
و 11 29 29 3 1 17 3 11 1 1 1 3 17
ي 3 10 2 1 3 2
ل 10 3 7 10 1
ل 3 1 6 4 1 3 20 4 9
م 2 5 3 9 1 2 5 1 1 3
ن 1 9 9 7 1 5 2 36 3 5
عن 43 50 39 3 2 5 2 12 4 3 2 3 2
ص 41 1 6 2 2

الجزء 3

أ ب في ز د ه و ز و ي ل ل م ن عن ص
ر 55 1 4 4 3 37 3 1 24 3 1 3 7 56 2
مع 8 1 7 1 2 25 6 40 13 3 9 27 11
ت 35 1 27 1 3 31 1 28 5 1 1 11 56 4
ش 1 4 4 4 11 2 6 3 2 8 5 5 5 1 5
ف 2 2 2 1
X 4 1 4 1 3 1 2 3 4 3 3 4 18 5
ج 3 7 10 2 1
ح 12 23 13 2 6
ش 5 11 14 1 2 2 2
SCH 3 8 6 1
ي 1 9 1 3 12 2 4 7 3 6 6 3 2 10
ب 2 4 1 1 2 2 2 6 3 13 2 4
ه 1 1
يو 2 1 2 1 3 1 1 1 1 1 3
أنا 1 3 9 1 3 3 1 5 3 2 3 3 4 6 3 6

الجزء 4

ر مع ت ش ف X ج ح ش SCH ي ب ه يو أنا
ر 1 5 9 16 1 1 1 2 8 3 5
مع 4 11 82 6 1 1 2 2 1 8 17
ت 26 18 2 10 1 11 21 4
ش 7 14 7 1 8 3 2 9 1
ف 1 1
X 3 4 2 2 1 1
ج 1 1
ح 7 1 1 1
ش 1 1
SCH 1
ي 3 9 4 1 16 1 2
ب 1 11 3 1 4 1 3 1
ه 1 9
يو 1 1 7 1 1 4
أنا 3 6 10 2 1 4 1 1 1 1 1

طاولات جميلة ك-gram يسهل الحصول عليه باستخدام نصوص الإصدارات الإلكترونية للعديد من الكتب الموجودة على أقراص مدمجة.

للحصول على معلومات أكثر دقة حول النصوص العادية، يمكنك إنشاء الجداول وتحليلها ك-جرام في ك>2، ولكن للأغراض التعليمية يكفي أن نقتصر على الصور الكبيرة. التفاوت ك-gram (وحتى الكلمات) يرتبط ارتباطًا وثيقًا بـ ميزة مميزةنص مفتوح - وجود عدد كبير من التكرارات لأجزاء النص الفردية: الجذور والنهايات واللواحق والكلمات والعبارات. لذلك، بالنسبة للغة الروسية، فإن هذه الأجزاء المألوفة هي أكثر الأشكال الكبيرة والثلاثية شيوعًا:

ST، ولكن، EN، TO، NA، OV، NI، RA، VO، KO
ستو، إينو، نوفمبر، توف، أوفو، أوفا

تعتبر المعلومات حول توافق الحروف، أي حول الروابط المفضلة للحروف مع بعضها البعض، مفيدة، والتي يمكن الحصول عليها بسهولة من جداول تكرار البيجرام.

يشير هذا إلى جدول يقع فيه "الجيران" الأكثر تفضيلاً على يسار ويمين كل حرف (بترتيب تنازلي لتكرار البيجرامات المقابلة). تشير هذه الجداول عادةً أيضًا إلى نسبة حروف العلة والحروف الساكنة (بالنسبة المئوية) التي تسبق (أو تلي) حرفًا معينًا.

مزيج من الحروف الروسية:

ز مع غادر يمين ز مع
3 97 ل، د، ك، ر، الخامس، ص، ن أ ل، ن، ق، ر، ص، الخامس، ك، م 12 88
80 20 أنا، ه، ذ، أنا، أ، س ب س، ق، ه، أ، ص، ص 81 19
68 32 ط، ر، أ، ه، ط، س في س، أ، ط، ق، ق، ن، ل، ص 60 40
78 22 ص، ص، أ، ط، ه، س ز س، أ، ع، ل، ط، الخامس 69 31
72 28 ص، ط، ذ، أ، ط، ه، س د ه، أ، ط، س، ن، ذ، ص، الخامس 68 32
19 81 م، ط، ل، د، ر، ص، ن ه ن، ر، ص، ق، ل، ت، م، ط 12 88
83 17 ص، ه، ط، أ، ذ، س و ه، ط، د، أ، ن 71 29
89 11 س، ه، أ، و ز أ، ن، ج، س، م، د 51 49
27 73 ص، ر، م، ط، س، ل، ن و ق، ن، ج، ط، ه، م، ك، ح 25 75
55 45 ب، ت، ه، س، أ، ط، ق ل س، أ، ط، ص، ذ، ر، ل، ه 73 27
77 23 ز، ت، ق، ط، ه، س، أ ل أنا، ه، يا، أ، ب، أنا، يو، ذ 75 25
80 20 أنا، ق، أ، أنا، ه، س م أنا، ه، س، ذ، أ، ن، ص، ق 73 27
55 45 د، ب، ن، س ن س، أ، ط، ه، ق، ن، ص 80 20
11 89 ص، ص، ك، الخامس، ر، ن عن ج، ق، ر، ص، ط، د، ن، م 15 85
65 35 في، مع، ذ، أ، ط، ه، س ص س، ع، ه، أ، ذ، ط، ل 68 32
55 45 ط، ك، ر، أ، ص، س، ه ر أ، ه، س، ط، ذ، ط، ق، ن 80 20
69 31 ق، ر، ت، أ، ه، ط، س مع ر، ك، س، ط، ه، ب، ق، ن 32 68
57 43 ح، ذ، ط، أ، ه، س، س ت س، أ، ه، ط، ب، ت، ص، ق 63 37
15 85 ع، ر، ك، د، ن، م، ص ش ر، ص، ق، د، ن، ص، ث 16 84
70 30 ن، أ، ه، س، و ف و، ه، س، أ، ه، س، أ 81 19
90 10 ذ، ه، س، أ، ق، و X س، ط، ق، ن، الخامس، ص، ص 43 57
69 31 ه، يو، ن، أ، و ج أنا، ه، أ، ق 93 7
82 18 ه، أ، ذ، ط، س ح ه، ط، ر، ن 66 34
67 33 ب، ذ، ق، ه، س، أ، ط، الخامس ش ه، ط، ن، أ، س، ل 68 32
84 16 ه، ب، أ، ط، ذ SCH ه، ط، أ 97 3
0 100 م، ص، ر، ق، ب، ج، ن ي ل، س، ه، م، ط، الخامس، ق، ن 56 44
0 100 ن، ق، ر، ل ب ن، ك، الخامس، ص، ق، ه، س، و 24 76
14 86 ق، ق، م، ل، د، ر، ص، ن ه ن، ر، ص، ق، ك 0 100
58 42 ب، س، أ، ط، ل، ذ يو د، ر، ش، ج، ن، ص 11 89
43 57 س، ن، ص، ل، أ، ط، ق أنا ج، ق، ر، ع، د، ك، م، ل 16 84

عند تحليل مدى توافق الحروف مع بعضها البعض، يجب أن يؤخذ في الاعتبار اعتماد مظهر الحروف في النص العادي على عدد كبير من الحروف السابقة. لتحليل هذه الأنماط، يتم استخدام مفهوم الاحتمال الشرطي.

تظهر ملاحظات النصوص الواضحة أن عدم المساواة التالية تنطبق على الاحتمالات الشرطية: ص(أ i1)≠ص(أ i1 /أ i2), ص(أ i1 /أ i2)≠ص(أ i1 /أ i2 أ i3),....

تمت دراسة مسألة اعتماد الحروف الأبجدية في النص العادي على الحروف السابقة بشكل منهجي من قبل عالم الرياضيات الروسي الشهير أ. أ. ماركوف (1856 - 1922). وأثبت أن حدوث الحروف في النص العادي لا يمكن اعتباره مستقلاً عن بعضه البعض. في هذا الصدد، أشار A. A. Markov إلى نمط مستقر آخر من النصوص المفتوحة المرتبطة بتناوب حروف العلة والحروف الساكنة. قام بحساب تكرار حدوث حروف العلة الكبيرة ( ز, ز) ، حرف العلة ( ز, مع) ، حرف العلة الساكن ( مع, ز) ، ساكن ساكن ( مع, مع) في النص الروسي بطول 10 5 أحرف. تظهر نتائج الحساب في الجدول التالي:

ز مع المجموع
ز 6588 38310 44898
مع 38296 16806 55102

من هذا الجدول، يمكن ملاحظة أن اللغة الروسية تتميز بتناوب حروف العلة والحروف الساكنة، ويمكن أن تكون الترددات النسبية بمثابة تقديرات تقريبية للاحتمالات الشرطية وغير المشروطة المقابلة:

ص(ز/مع)≈0.663, ص(مع/ز)≈0.872,
ص(ز)≈0.432, ص(مع)≈0.568.

بعد A. A. Markov، تمت دراسة الاعتماد على ظهور الحروف في النص، بعد العديد من الحروف السابقة، من خلال أساليب نظرية المعلومات بواسطة K. Shannon. في الواقع، أظهروا، على وجه الخصوص، أن مثل هذا الاعتماد ملحوظ على عمق حوالي 30 حرفًا، وبعد ذلك يكون غائبًا عمليًا.

نسبة حروف العلة في النص الأدبي:

تنطبق الأنماط المذكورة أعلاه على النصوص العادية "القابلة للقراءة" المستخدمة في التواصل البشري. كما ذكرنا سابقًا، تلعب هذه الأنماط دورًا كبيرًا في تحليل الشفرات. على وجه الخصوص، يتم استخدامها في بناء معايير رسمية للنص العادي، مما يجعل من الممكن تطبيق أساليب الإحصاء الرياضي في مشكلة التعرف على النص العادي في تدفق الرسائل. عند استخدام أبجديات خاصة، يلزم إجراء دراسات مماثلة لخصائص تردد "النصوص المفتوحة" التي تنشأ، على سبيل المثال، أثناء تبادل المعلومات من آلة إلى آلة أو في أنظمة نقل البيانات. وفي هذه الحالات، يكون بناء معايير رسمية "للنص الواضح" مهمة أكثر صعوبة بكثير.

على سبيل المثال، نعطي خصائص تردد الحروف الأبجدية الإنجليزية، المدرجة في رمز ASCII.

بالإضافة إلى التشفير، يتم استخدام خصائص تردد الرسائل الواضحة بشكل كبير في مجالات أخرى. على سبيل المثال، تعد لوحة مفاتيح الكمبيوتر أو الآلة الكاتبة أو Linotype تجسيدًا رائعًا لفكرة تسريع الكتابة، المرتبطة بتحسين ترتيب الحروف الأبجدية بالنسبة لبعضها البعض، اعتمادًا على تكرار استخدامها.

الأدب:

ألفيروف أ.ب. وآخرون، "التشفير"

ياجلوم إيه إم، ياجلوم آي إم، الاحتمالية والمعلومات، م: ناوكا، 1973.

بودوان سي.، عناصر التشفير / إد. بيدوني أ. – باريس، 1939.

فريدمان دبليو إف، كاليمهوس د.، تحليل الشفرات العسكري، الجزء الأول، المجلد 2، مطبعة إيجين بارك، لاجونا هيلز كاليفورنيا، 1920.

ما هو الحرف الأكثر استخداما باللغة الروسية؟ وما هي أسهل طريقة لمعرفة ذلك والحصول على أفضل إجابة

الرد من فيكتور إدينوفيتش[المعلم]

الجواب الصحيح الوحيد! في وقت ما، كان أي مطبعي يعرف من خلال تجربته الخط (الحرف) الأكثر استخدامًا عند الكتابة.
فيكتور إدينوفيتش
المستنير
(38377)
لا. أنا مجرد موسوعي سابق..

الرد من إليزافيتا فينتسيفيتش[المعلم]
أعتقد "أ".


الرد من الكسندرا لابيكوفا[المعلم]
حسب درجة تآكل لوحة مفاتيح الكاتب


الرد من YolaFka[المعلم]
بوكافكا آآآآآآآآآآه))))


الرد من بوبا بوباهوب[المعلم]
أعتقد أن حرف "X" دليل؟ فقط قم بالسير في الشارع


الرد من * [خبير]
الحروف الثلاثة الأكثر استخدامًا هي U Y X


الرد من على[المعلم]
ربما كوميرسانت


الرد من ديوسميكيف فاليري[المعلم]
حرف أ



الرد من &أنا[المعلم]
كيف يمزح الجميع. طبعا حرف الـ O !!!


الرد من بافل ماكاجونوف[المعلم]
O، ثم E، ثم I، ثم A. ثم الحروف الساكنة N، T، S، R، إلخ.
كان علي أن أقوم بالحسابات بناءً على عدد كبير من النصوص. لا تثق في مثيري الشغب.


الرد من ايلينا ستراثبيري[نشيط]
طبعا حرف الراء لأنه موجود في منتصف لوحة المفاتيح !! ! 🙂


الرد من إنجا زاجونتز[المعلم]
نحن نأخذ أي قاموس، وخاصة الكلمات التي تبدأ بـ "p"، وبعدها بـ "r"، وبعدها بـ "o"، وبعدها بـ "T"، وفي النهاية فإن الكلمة الأكثر تميزًا باللغة الروسية هي الرحابة والبساطة.
وفقا لداهل


الرد من ألكسندر ريزر[المعلم]
حاول تخمين أي حرف من اللغة الروسية هو الأكثر شيوعا؟
حرف O. تكرار الحدوث – 0.090. أي أنه في سلسلة مكونة من 1000 حرف، سيظهر الحرف O في المتوسط ​​90 مرة.
ما هي الحروف التي تشغل مناصب قيادية وتوجد في أغلب الأحيان؟
حروف العلة. وهي تلك التي توجد غالبًا في اللغة الروسية، مما يجعل خطابنا "رخيمًا". يلي O الحروف E و E (معًا، لا يتم فصلهما، لأنه عند الكتابة، غالبًا ما يفقدان E). تكرار الحدوث – 0.072. وخلفهم الحرفان A و I. تردد ظهور كل منهما هو 0.062.
هل هذا يكفي لفك تشفير النص؟ من حيث المبدأ، نعم، إذا كنا متأكدين من أن تسلسل الرموز يحتوي على نص باللغة الروسية في بعض الترميزات المعروفة لدينا أو غير المعروفة. ولكن هناك دائمًا بعض الاحتمال بأن تسلسل الرموز المقدم لا علاقة له باللغة الروسية. للتحقق من ذلك، تحتاج إلى استخدام قاموس تردد الكلمات في اللغة الروسية.
ما هي الكلمة التي تعتقد أنها تحدث غالبًا في اللغة الروسية؟
حرف العطف I يتبعه أجزاء قصيرة متساوية من الكلام - IN، NOT، OH، ON. ولكن في أغلب الأحيان، بالطبع، ستكون هناك فجوة.
يجب التحقق من تطابق النص الذي تم فك ترميزه باستخدام قاموس التردد. وفقط من خلال صدفة كاملة إلى حد ما، يمكننا أن نقول إننا نتعامل مع نص مكتوب باللغة الروسية.
وهذا يعطي نتائج 100% إذا كان النص كبيرًا بدرجة كافية. إذا كنا نتحدث عن عدة كلمات، فقد ينتهك تواتر الحروف (وحتى الكلمات أكثر). ماذا تفعل في هذه الحالة؟ نحن بحاجة إلى أن نقدم للقارئ عدة خيارات للاختيار من بينها. قم بفك تشفير النص باستخدام أحد حروف العلة الأكثر شيوعًا. حروف العلة! سوف تظهر دائمًا أكثر من الحروف الأخرى. إذا تم ترميز النص باللغة الروسية، فسيتم ضمان النجاح.