Rus dilində ən çox yayılmış hərflər. Rus dilində hərflərin istifadə tezliyi

Ümumiyyətlə, belə bir mövzu var - mətnin tezlik təhlili. Müəyyən bir dil üçün mənalı mətndə fərdi hərflərin rast gəlmə tezliyinin sabit dəyər olduğu iddia edilir. İki, üç (diqram, triqram) və dörd hərfin birləşmələri də sabitdir.
Bu fakt, xüsusən, şifrələri qırmaq üçün kriptoqrafiyada istifadə olunurdu.

Mən kriptoqrafiyada çox yaxşı deyiləm və ağlıma gələn yeganə şey birbaşa əvəzetmə şifrəsini pozmaqdır. Demək lazımdır ki, ən primitiv şifrə mesajda istifadə olunan orijinal əlifbanın simvollarının müəyyən qaydaya uyğun olaraq başqa simvollara çevrilməsidir. Bu cür şifrələr, yeri gəlmişkən, istifadə etmədən də açıla bilərdi statistik təhlil(burada, səhvi azaltmaq üçün kifayət qədər böyük mətn hissələrinin olması tələb olunur), ancaq bəzi sözləri təxmin etməklə - "Rəqs edən adamlar" hekayəsinə baxın.

Və son toxunuş (isteğe bağlı). Bəzən (demək olar ki, həmişə) kalkulyator təsviri ilə təmin edilməlidir - parametrlər nədir, hansı düsturlardan istifadə edir və ümumiyyətlə, bunun nə üçün olduğunu - indi etdiyim kimi. Bunun üçün məqalə yazılır və kalkulyator birbaşa məqaləyə daxil edilir. Məqalə yazmaq üçün “Mənim kalkulyatorlarım” bölməsinin əsas səhifəsində “Yarat...” -> “Məqalə” menyusunu seçin və yazmağa başlayın. Kalkulyator daxil etmək üçün altından böyük A hərfi olan düyməni basın və açılan dialoq pəncərəsində yeni yaradılmış kalkulyatoru seçin.

Rus əlifbasında ən çox yayılmış hərfi etibarlı şəkildə "o" adlandırmaq olar. "A" deyil, baxmayaraq ki, bütün uşaqlar ilk sözlərini bu hərflə öyrənirlər: "ana", "ata" və ya "ver". “Və” deyil, amma görünə bilər ki, biz onu tez-tez birləşdirici bağlayıcı kimi istifadə edirik.

Məlumatlardan göründüyü kimi, əlifbanın digər sait hərfləri ilə müqayisədə tezliyi 0,1%-dən çox olan “o” hərfidir, tezliyi məsələn, 0,07-0,08% təşkil edir ki, bu da kifayət qədər çoxdur.

Samitlər arasında “n” hərfi birinci gəlir.

Bu cür məlumatlar xüsusi düsturdan istifadə edərək NCRY - Rus Dilinin Milli Korpusunda tezliyi təhlil etməklə əldə edilir. NKRY təxminən 230 milyon söz istifadəsindən ibarət yazılı və şifahi mətnlərin elektron arxividir.

Əlifbamızın ən məşhur hərfini nəzərə alsaq, “tautoqram” adlanan maraqlı bir hadisəni qeyd etmək yerinə düşər. Bu, eyni hərflə başlayan bir hekayə və ya şeir yazmağınız lazım olan bir növ ədəbi istiləşmədir. Yeri gəlmişkən, rus dilində əksər sözlərin başladığı hərf (istifadə tezliyi ilə qarışdırmayın) "p" dir, lakin saitlər arasında şübhəsiz liderlik indiki sevimlimizə aiddir.

"Tək. Çox. Cazibə parçaları payızın monotonluğunda dağıldı. Olympus uzaq bir çıxış olaraq qaldı. Çox uzaq. Qısqanclıqlar qaldı, toxunma atəşindən qaynaqlanan ərimiş ərimənin tələsik tərifləri. Qalanları neqativ, rədd edilmiş, cəmiyyət tərəfindən aldadılmış oldu. Payızın nəsli büdrəyib gölün göz qalıqları ilə uçurdu. Bəzi pəncərələr açıq qaldı. Fərdi omonimlərin qəzəbli izləri şəxsiyyətin rədd edilmiş paltarları ilə kölgədə qalır. Dəniz itinin narıncı çalarları tənhalığın böyük əksi ilə təsvir edilmişdir. Qalanı sümükləşmə, əzabın uyuşmasıdır. Adalar əminliklə bağlı esselərdən gələn andlarla doludur. Soyuyan qızılağac şlamları boğuq qışqırıqlara görə eyni adlı dairələr meydana gətirdi. Məmur mənfi müəyyənlikləri aradan qaldıraraq generalın əksinə çevrildi. Məskunlaşmış görüntülər küskünlüklə payız cəfəngiyyatını izah edir, əksini aldatma adlandırırdı. Gənclər obyektiv münasibəti inkar edərək, ovsunlu payızın naəlaclıqla təsvirini çəkdilər... Payız çaytikanının narıncı parçaları kimi uçurdu, yorğun mübahisələri tənha cavablara buraxırdı..."

Gülməli, elə deyilmi? O qədər də cəfəngiyat deyil :)

Yeri gəlmişkən, ingilis dilində ən çox yayılmış hərf “e”, samit isə “t”dir.

Yaxşı və ingilis dilində tautoqram:

Minerva kimi əzəmətli Məryəm hərəkət edir.

Hüquq, Latın, Liberty, Lucy'yi sevdiyini öyrəndi.

Elizanın zərifliyi hər gözə casusluq edir.

Sakitcəsinə səssiz Susanın təbəssümləri təəccübləndirdi.

Axmaqlardan, axmaqlardan, yaltaqlardan, ən ədalətli Fanny uçur.

Məlumdur ki, çap maşınının və ya fərdi kompüterin klaviaturasında hərflərin düzülüşü təsadüfi tərtib olunmur, müəyyən qaydalara tabedir. Beləliklə, ən çox istifadə olunan hərflər klaviaturanın mərkəzi hissəsində, daha az yayılmış hərflər isə kənarlarda yerləşir. O da məlumdur ki, samitlərdən daha çox saitlər işlədilir. Bu məlumat Rus Dilinin Milli Korpusunda xüsusi düsturdan istifadə etməklə əldə edilib.

Ən çox yayılmış saitlər

Qəribədir ki, “o” hərfi yazılı nitqdə həm saitlər, həm də samitlər arasında istifadə sayına görə liderdir. Ondan sonra “a” və “və” gəlir və bundan sonra samitlər başlayır. Mütəxəssislərin fikrincə, “o” hərfinin istifadə tezliyi faizin onda biri, digər saitlərin tezliyi isə faizin yeddi yüzdən səkkiz yüzdə biri arasında dəyişir.

Ən məşhur samitlər

Ən çox istifadə olunan samit “n”dir. Üstəlik, rus dilində ən çox söz "p" hərfi ilə başlayır. Saitlər arasında “o” bu baxımdan liderdir.

Rus nitqində ən nadir samit, mənşəli sözlərdə istifadə olunan “f” hərfidir xarici dillər, həmçinin onomatopeyalar, məsələn, “xırıltı”.

Bu cür statistika tautoqramlar tərtib edərkən faydalı ola bilər. Bu söz oyununun məqsədi hər bir sözün eyni hərflə başlamalı olduğu ardıcıl bir hekayə yaratmaqdır.

Bu yazıda biz son dərəcə müzakirəyə başlayacağıq maraqlı mövzu- mətn məlumatlarının təhlili üçün statistikanın tətbiqi. Qeyd edək ki, mətnin təhlili üçün statistikadan istifadə ənənəvi bir işdir.

Əvvəlcə bəzilərini verəcəyik maraqlı faktlar müxtəlif dillərdə hərflərin və onların birləşmələrinin tezliyi ilə bağlı (ətraflı məlumat üçün kitaba baxın). Sonrakı məqalələrdə daha mürəkkəb təhlil və qrafik təsvir üsullarını necə tətbiq edəcəyimizi göstərəcəyik.

Mətn mesajlarının tezlik xüsusiyyətləri

Deməli, mətn sözlərdən, hərf sözlərindən ibarətdir. Hər dildə müxtəlif hərflərin sayı məhduddur və hərfləri sadəcə sadalamaq olar. Mətnin mühüm xüsusiyyətləri hərflərin təkrarlanması, hərflərin cütləri (diaqramları) və ümumiyyətlə m-Yaxşı ( m-qram), hərflərin bir-biri ilə uyğunluğu, sait və samitlərin növbələşməsi və bəziləri. Bu xüsusiyyətlərin kifayət qədər sabit olması diqqətəlayiqdir. “Niyə” sualını pərdə arxasına qoyuruq.

Sistemdən istifadə STATİSTİKA Bu nümunələri, məsələn, İnternet mətnlərində yoxlaya bilərsiniz.

İdeya, hər birinin baş vermə sayını saymaqdır n m mümkündür m kifayət qədər uzun düz mətnlərdə -qram T=t 1 t 2 …t l, əlifbanın hərflərindən ibarətdir ( a 1 , a 2 , ..., a n). Eyni zamanda, ardıcıl m- qram mətn:

t 1 t 2 ...t m , t 2 t 3 ... t m+1 , ..., t i-m+1 t l-m+2 ...t l.

Əgər – baş verənlərin sayı m-qram a i1 və i2 ...a im mətndə T, A L- hesablananların ümumi sayı m-qram, o zaman təcrübə göstərir ki, kifayət qədər böyükdür L tezliklər

bunun üçün m-qramlar bir-birindən az fərqlənir.

Buna görə nisbi tezlik (1) ehtimalın təxmini hesab olunur P (a i1 və i2 ...a im) bunun görünüşü m-qramlar mətndə təsadüfi seçilmiş yerdə (bu yanaşma ehtimalın statistik müəyyən edilməsində qəbul edilir).

Aşağıda bir sıra Avropa dilləri üçün hərf tezliklərinin cədvəli (faizlə) verilmişdir. Məlumatlar kitabdan götürülüb.

Əlifbanın hərfi fransız alman İngilis dili ispan dili italyan
A 7.68 5.52 7.96 12.90 11.12
B 0.80 1.56 1.60 1.03 1.07
C 3.32 2.94 2.84 4.42 4.11
D 3.60 4.91 4.01 4.67 3.54
E 17.76 19.18 12.86 14.15 11.63
F 1.06 1.96 2.62 0.70 1.15
G 1.10 3.60 1.99 1.00 1.73
H 0.64 5.02 5.39 0.91 0.83
I 7.23 8.21 7.77 7.01 12.04
J 0.19 0.16 0.16 0.24 -
K - 1.33 0.41 - -
L 5.89 3.48 3.51 5.52 5.95
M 2.72 1.69 2.43 2.55 2.65
N 7.61 10.20 7.51 6.20 7.68
O 5.34 2.14 6.62 8.84 8.92
P 3.24 0.54 1.81 3.26 2.66
Q 1.34 0.01 0.17 1.55 0.48
R 6.81 7.01 6.83 6.95 6.56
S 8.23 7.07 6.62 7.64 4.81
T 7.30 5.86 9.72 4.36 7.07
U 6.05 4.22 2.48 4.00 3.09
V 1.27 0.84 1.15 0.67 1.67
W - 1.38 1.80 - -
X 0.54 - 0.17 0.07 -
Y 0.21 - 1.52 1.05 -
Z 0.07 1.17 0.05 0.31 1.24

Müxtəlif mənbələrdə verilmiş cədvəllərdə tezlik dəyərlərindəki bəzi fərq, tezliklərin təkcə mətnin uzunluğundan deyil, həm də təbiətindən əhəmiyyətli dərəcədə asılı olması ilə izah olunur. Məsələn, texniki mətnlərdə nadir məktub F funksiya, diferensial, diffuziya, əmsal və s. kimi sözlərin tez-tez işlədilməsi səbəbindən kifayət qədər adi hala çevrilə bilər.

Bəzilərində fərdi hərflərin istifadə tezliyində normadan daha böyük sapmalar müşahidə olunur sənət əsərləri, xüsusən də şeirdə. Buna görə də, məktubların orta tezliyini etibarlı şəkildə müəyyən etmək üçün müxtəlif mənbələrdən götürülmüş müxtəlif mətnlər toplusunun olması arzu edilir. Bununla belə, bir qayda olaraq, bu cür sapmalar əhəmiyyətsizdir və ilk yaxınlaşmada onları laqeyd etmək olar.

Hərflərin tezliklərinin vizual təsviri baş vermə diaqramı ilə verilir. Beləliklə, ingilis dili üçün cədvələ uyğun olaraq belə bir diaqram Şəkil 1-də göstərilmişdir. Onu qurmaq üçün sistemdən istifadə etdik STATİSTİKA.

Rus dili üçün əlifbanın simvollarının müəyyən edildiyi tezliklər (azalan qaydada) E c Yo, b ilə Kommersant, və sözlər arasında boşluq (-) işarəsi də var, aşağıdakı cədvəldə verilmişdir (bax).

-
0.175
HAQQINDA
0.090
ONU
0.072
A
0.062

0.062
T
0.053
N
0.053
İLƏ
0.045
R
0.040
IN
0.038
L
0.035
TO
0.028
M
0.026
D
0.025
P
0.023
U
0.021
I
0.018
Y
0.016
Z
0.016
b, b
0.014
B
0.014
G
0.013
H
0.012
Y
0.010
X
0.009

0.007
Yu
0.006
Ş
0.006
C
0.004
SCH
0.003
E
0.003
F
0.002

Cədvəl əsasında aşağıdakı tezlik diaqramını alırıq (şək. 2).

Rus əlifbasının ən çox yayılmış on hərfini yadda saxlamaq üçün mnemonik qayda var. Bu hərflər gülməli HAY sözünü təşkil edir. Siz həmçinin ingilis dilində ümumi hərfləri yadda saxlamağın oxşar üsulunu təklif edə bilərsiniz, məsələn, TETRIS-HONDA sözündən istifadə etməklə (cədvələ bax).

Biqramların, triqramların və dördqramlıq mənalı mətnlərin tezlik xüsusiyyətləri də sabitdir.

Budur rus və üçün biqram tezliklərin cədvəlləri İngilis dilləri(kitabdan götürülmüş cədvəllər). Rahatlıq üçün onlar aşağıdakı sxemə görə dörd hissəyə bölünürlər:

1-ci hissə 2-ci hissə
3-cü hissə 4-cü hissə

1-ci hissə

A B IN G D E Z Y TO L M N HAQQINDA P
A 2 12 35 8 14 7 6 15 7 7 19 27 19 45 5 11
B 5 9 1 6 6 2 21
IN 35 1 5 3 3 32 2 17 7 10 3 9 58 6
G 7 3 3 5 1 5 1 50
D 25 3 1 1 29 1 1 13 1 5 1 13 22 3
E 2 9 18 11 27 7 5 10 6 15 13 35 24 63 7 16
5 1 6 12 5 6
Z 35 1 7 1 5 3 4 2 1 2 9 9 1
4 6 22 5 10 21 2 23 19 11 19 21 20 32 8 13
Y 1 1 4 1 3 1 2 4 5 1 2 7 9 7
TO 24 1 4 1 4 1 1 26 1 4 1 2 66 2
L 25 1 1 1 1 33 2 1 36 1 2 1 8 30 2
M 18 2 4 1 1 21 1 2 23 3 1 3 7 19 5
N 54 1 2 3 3 34 58 3 1 24 67 2
HAQQINDA 1 28 84 32 47 15 7 18 12 29 19 41 38 30 9 18
P 7 15 4 9 1 46

2-ci hissə

R İLƏ T U F X C H Ş SCH Y b E Yu I
A 26 31 27 3 1 10 6 7 10 1 2 6 9
B 8 1 6 1 11 2
IN 6 19 6 7 1 1 2 4 1 18 1 2 3
G 7 2
D 6 8 1 10 1 1 1 5 1 1
E 39 37 33 3 1 8 3 7 3 3 1 1 2
1
Z 3 1 2 4 4
11 29 29 3 1 17 3 11 1 1 1 3 17
Y 3 10 2 1 3 2
TO 10 3 7 10 1
L 3 1 6 4 1 3 20 4 9
M 2 5 3 9 1 2 5 1 1 3
N 1 9 9 7 1 5 2 36 3 5
HAQQINDA 43 50 39 3 2 5 2 12 4 3 2 3 2
P 41 1 6 2 2

3-cü hissə

A B IN G D E Z Y TO L M N HAQQINDA P
R 55 1 4 4 3 37 3 1 24 3 1 3 7 56 2
İLƏ 8 1 7 1 2 25 6 40 13 3 9 27 11
T 35 1 27 1 3 31 1 28 5 1 1 11 56 4
U 1 4 4 4 11 2 6 3 2 8 5 5 5 1 5
F 2 2 2 1
X 4 1 4 1 3 1 2 3 4 3 3 4 18 5
C 3 7 10 2 1
H 12 23 13 2 6
Ş 5 11 14 1 2 2 2
SCH 3 8 6 1
Y 1 9 1 3 12 2 4 7 3 6 6 3 2 10
b 2 4 1 1 2 2 2 6 3 13 2 4
E 1 1
Yu 2 1 2 1 3 1 1 1 1 1 3
I 1 3 9 1 3 3 1 5 3 2 3 3 4 6 3 6

4-cü hissə

R İLƏ T U F X C H Ş SCH Y b E Yu I
R 1 5 9 16 1 1 1 2 8 3 5
İLƏ 4 11 82 6 1 1 2 2 1 8 17
T 26 18 2 10 1 11 21 4
U 7 14 7 1 8 3 2 9 1
F 1 1
X 3 4 2 2 1 1
C 1 1
H 7 1 1 1
Ş 1 1
SCH 1
Y 3 9 4 1 16 1 2
b 1 11 3 1 4 1 3 1
E 1 9
Yu 1 1 7 1 1 4
I 3 6 10 2 1 4 1 1 1 1 1

Gözəl masalar k-qramı CD-lərdə olan bir çox kitabın elektron versiyalarının mətnlərindən istifadə etməklə əldə etmək asandır.

Düz mətnlər haqqında daha dəqiq məlumat əldə etmək üçün cədvəllər qura və təhlil edə bilərsiniz k-qram k>2, lakin təhsil məqsədləri üçün özümüzü biqramlarla məhdudlaşdırmaq kifayətdir. Qeyri-bərabərlik k-qram (və hətta sözlər) ilə sıx bağlıdır xarakterik xüsusiyyət açıq mətn - ayrı-ayrı mətn fraqmentlərinin çox sayda təkrarının olması: köklər, sonluqlar, şəkilçilər, sözlər və ifadələr. Beləliklə, rus dili üçün belə tanış fraqmentlər ən çox yayılmış biqramlar və triqramlardır:

ST, BUT, EN, TO, NA, OV, NI, RA, VO, KO
STO, ENO, NOV, TOV, OVO, OVA

Hərflərin uyğunluğu, yəni hərflərin bir-biri ilə üstünlük təşkil etdiyi əlaqələr haqqında məlumat faydalıdır, bunu biqram tezlik cədvəllərindən asanlıqla əldə etmək olar.

Bu, ən çox seçilən "qonşuların" hər hərfin solunda və sağında yerləşdiyi cədvələ aiddir (müvafiq biqramların tezliyinin azalan sırası ilə). Belə cədvəllər adətən verilmiş hərfdən əvvəlki (və ya ondan sonrakı) sait və samitlərin nisbətini (faizlə) göstərir.

Rus hərflərinin birləşməsi:

G İLƏ Sol Sağ G İLƏ
3 97 l, d, k, t, v, r, n A l, n, s, t, r, v, k, m 12 88
80 20 i, e, y, i, a, o B o, s, e, a, r, y 81 19
68 32 i, t, a, e, i, o IN o, a, i, s, s, n, l, r 60 40
78 22 r, y, a, i, e, o G o, a, p, l, i, v 69 31
72 28 r, i, y, a, i, e, o D e, a, i, o, n, y, p, v 68 32
19 81 m, i, l, d, t, r, n E n, t, r, s, l, v, m, i 12 88
83 17 r, e, i, a, y, o e, i, d, a, n 71 29
89 11 o, e, a, və Z a, n, c, o, m, d 51 49
27 73 r, t, m, i, o, l, n s, n, c, i, e, m, k, h 25 75
55 45 b, v, e, o, a, i, s TO o, a, i, p, y, t, l, e 73 27
77 23 g, v, s, i, e, o, a L i, e, o, a, b, i, yu, y 75 25
80 20 i, s, a, i, e, o M i, e, o, y, a, n, p, s 73 27
55 45 d, b, n, o N o, a, i, e, s, n, y 80 20
11 89 r, p, k, v, t, n HAQQINDA c, s, t, r, i, d, n, m 15 85
65 35 içində, ilə, y, a, i, e, o P o, p, e, a, y, i, l 68 32
55 45 i, k, t, a, p, o, e R a, e, o, i, y, i, s, n 80 20
69 31 s, t, v, a, e, i, o İLƏ t, k, o, i, e, b, s, n 32 68
57 43 h, y, i, a, e, o, s T o, a, e, i, b, v, r, s 63 37
15 85 p, t, k, d, n, m, r U t, p, s, d, n, y, w 16 84
70 30 n, a, e, o, və F və, e, o, a, e, o, a 81 19
90 10 y, e, o, a, s, və X o, i, s, n, v, p, r 43 57
69 31 e, yu, n, a, və C i, e, a, s 93 7
82 18 e, a, y, i, o H e, i, t, n 66 34
67 33 b, y, s, e, o, a, i, v Ş e, i, n, a, o, l 68 32
84 16 e, b, a, i, y SCH e, mən, a 97 3
0 100 m, r, t, s, b, c, n Y l, x, e, m, i, v, s, n 56 44
0 100 n, s, t, l b n, k, v, p, s, e, o, və 24 76
14 86 s, s, m, l, d, t, r, n E n, t, r, s, k 0 100
58 42 b, o, a, i, l, y Yu d, t, sch, c, n, s 11 89
43 57 o, n, r, l, a, i, s I c, s, t, p, d, k, m, l 16 84

Hərflərin bir-biri ilə uyğunluğunu təhlil edərkən, düz mətndəki hərflərin görünüşünün əhəmiyyətli sayda əvvəlki hərflərdən asılılığını nəzərə almaq lazımdır. Bu nümunələri təhlil etmək üçün şərti ehtimal anlayışından istifadə olunur.

Açıq mətnlərin müşahidələri göstərir ki, şərti ehtimallar üçün aşağıdakı bərabərsizliklər mövcuddur: p(a i1)≠p(a i1 /a i2), p(a i1 /a i2)≠p(a i1 /a i2 a i3),....

Düz mətndə olan əlifba hərflərinin əvvəlki hərflərdən asılılığı məsələsi məşhur rus riyaziyyatçısı A. A. Markov (1856 – 1922) tərəfindən sistemli şəkildə tədqiq edilmişdir. O, sübut etdi ki, açıq mətndə hərflərin baş verməsini bir-birindən müstəqil hesab etmək olmaz. Bu baxımdan A. A. Markov sait və samitlərin növbələşməsi ilə bağlı açıq mətnlərin başqa bir sabit modelini qeyd etdi. O, sait-sait biqramlarının baş vermə tezliyini hesablamışdır ( G, G), sait-samit ( G, ilə), samit-sait ( ilə, G), samit-samit ( ilə, ilə) rus dilində 10 5 simvol uzunluğunda mətn. Hesablama nəticələri aşağıdakı cədvəldə göstərilir:

G İLƏ Cəmi
G 6588 38310 44898
İLƏ 38296 16806 55102

Bu cədvəldən görünür ki, rus dili sait və samitlərin dəyişməsi ilə xarakterizə olunur və nisbi tezliklər müvafiq şərti və qeyd-şərtsiz ehtimalların yaxınlaşması kimi xidmət edə bilər:

səh(G/ilə)≈0.663, səh(ilə/G)≈0.872,
səh(G)≈0.432, səh(ilə)≈0.568.

A. A. Markovdan sonra bir neçə əvvəlkilərdən sonra mətndə hərflərin görünüşünün asılılığını K. Şennon informasiya nəzəriyyəsi metodları ilə öyrənmişdir. Əslində, xüsusilə göstərdilər ki, belə bir asılılıq təxminən 30 simvol dərinliyinə qədər nəzərə çarpır, bundan sonra praktiki olaraq yoxdur.

Bədii mətndə saitlərin nisbəti:

Yuxarıdakı nümunələr insan ünsiyyətində istifadə olunan adi “oxunan” açıq mətnlərə aiddir. Daha əvvəl qeyd edildiyi kimi, bu nümunələr kriptoanalizdə böyük rol oynayır. Xüsusilə, onlar açıq mətn üçün rəsmiləşdirilmiş meyarların qurulmasında istifadə olunur ki, bu da mesaj axınında açıq mətnin tanınması problemində riyazi statistikanın üsullarını tətbiq etməyə imkan verir. Xüsusi əlifbalardan istifadə edərkən, məsələn, maşından maşına məlumat mübadiləsi zamanı və ya məlumat ötürmə sistemlərində yaranan "açıq mətnlərin" tezlik xüsusiyyətlərinin oxşar tədqiqatları tələb olunur. Bu hallarda “aydın mətn” üçün rəsmiləşdirilmiş meyarların yaradılması daha çətin məsələdir.

Nümunə olaraq hərflərin tezlik xüsusiyyətlərini veririk Ingilis əlifbası, ASCII koduna daxildir.

Kriptoqrafiyaya əlavə olaraq, aydın mesajların tezlik xüsusiyyətləri digər sahələrdə əhəmiyyətli dərəcədə istifadə olunur. Məsələn, kompüter klaviaturası, yazı maşını və ya Linotype, istifadə tezliyindən asılı olaraq əlifba hərflərinin bir-birinə nisbətən düzülməsini optimallaşdırmaqla əlaqəli yazmağı sürətləndirmək ideyasının gözəl təcəssümüdür.

Ədəbiyyat:

Alferov A.P. və başqaları, "Kriptoqrafiya"

Yaqlom A.M., Yaqlom İ.M., Ehtimal və məlumat, M.: Nauka, 1973.

Baudouin C., Elements de cryptographie / Ed. Pedone A. – Paris, 1939.

Friedman W. F., Callimahos D., Military kriptoanaliz, Part i, Vol 2, Egean Park Press, Laguna Hills CA, 1920.

Rus dilində ən çox hansı hərf istifadə olunur? Və tapmaq üçün ən asan yol nədir və ən yaxşı cavabı alırsınız

Viktor Edinoviçdən cavab [guru]

Yeganə düzgün cavab! Vaxtilə istənilən mətbəəçi öz təcrübəsindən bilirdi ki, yazı yazarkən ən çox hansı şriftdən (hərfdən) istifadə olunur.
Viktor Edinoviç
Maariflənmiş
(38377)
yox. Mən sadəcə keçmiş ensiklopediyaçıyam...

-dan cavab Elizaveta Ventseviç[quru]
Məncə "A".


-dan cavab Aleksandra Lapikova[quru]
yazıçının klaviaturasındakı aşınma dərəcəsinə görə


-dan cavab YolaFka[quru]
bukaFka AAAAAAAAAAAA))))


-dan cavab BOBA BOBAHOB[quru]
Məncə “X” hərfi sübutdur? sadəcə küçədə gəzin


-dan cavab * [ekspert]
ən çox istifadə olunan 3 hərf U Y X-dir


-dan cavab Aktiv[quru]
yəqin ki, Kommersant


-dan cavab Dyusmikeev Valeri[quru]
Hərf A



-dan cavab [quru]
Hamı necə zarafat edir. Təbii ki, O hərfi!!!


-dan cavab Pavel Makaqonov[quru]
O, sonra E, sonra I, sonra A. Sonra samitlər N, T, S, R və s.
Çoxlu sayda mətn əsasında riyaziyyatı etməli oldum. Xuliqanlara etibar etməyin.


-dan cavab Elena Strathberry[aktiv]
Əlbəttə R hərfi. Çünki klaviaturanın ortasındadır!! ! 🙂


-dan cavab Inga zajontz[quru]
istənilən lüğəti götürürük, ən çox “p”, “r” hərfi ilə başlayan, “o”dan sonra, “T” hərfindən sonra, sonda rus dili üçün ən xarakterik söz genişlik və sadəlikdir.
Dahla görə


-dan cavab Alexander Reiser[quru]
Rus dilinin hansı hərfinin ən çox yayıldığını təxmin etməyə çalışın?
O hərfi. Baş vermə tezliyi – 0,090. Yəni 1000 hərf ardıcıllığında O hərfi orta hesabla 90 dəfə görünəcək.
Hansı hərflər aparıcı mövqeləri tutur və ən çox rast gəlinir?
Saitlər. Onlar rus dilində ən çox rast gəlinən və nitqimizi “melodik” edənlərdir. O-dan sonra E və E hərfləridir (birlikdə onlar ayrılmır, çünki yazarkən çox vaxt E-ni itirirlər). Baş vermə tezliyi – 0,072. Onların arxasında A və I hərfləri var. Onların hər birinin görünmə tezliyi 0,062-dir.
Bu mətnin şifrəsini açmaq üçün kifayətdirmi? Prinsipcə, bəli, əgər kodların ardıcıllığında bizə məlum olan və ya naməlum olan bəzi kodlaşdırmalarda rus dilində mətnin olduğuna əmin olsaq. Ancaq təqdim olunan kodlar ardıcıllığının rus dili ilə heç bir əlaqəsi olmadığı ehtimalı həmişə var. Bunu yoxlamaq üçün rus dilində sözlərin tezlik lüğətindən istifadə etməlisiniz.
Sizcə rus dilində ən çox hansı sözə rast gəlinir?
I bağlayıcısından sonra eyni dərəcədə qısa nitq hissələri gəlir - IN, NOT, OH, ON. Ancaq çox vaxt, əlbəttə ki, bir boşluq olacaq.
Deşifrə olunmuş mətn tezlik lüğətindən istifadə edərək uyğunluq üçün yoxlanılmalıdır. Və yalnız az-çox tam təsadüflə deyə bilərik ki, biz rus dilində yazılmış mətnlə məşğul oluruq.
Mətn kifayət qədər böyükdürsə, bu, 100% nəticə verir. Bir neçə sözdən danışırıqsa, hərflərin tezliyi (və daha çox sözlərin) pozula bilər. Bu halda nə etməli? Oxucuya seçim etmək üçün bir neçə variant təklif etməliyik. Ən çox yayılmış sait hərflərdən birini istifadə edərək mətni deşifrə edin. Saitlər! Onlar həmişə digər hərflərdən daha tez-tez görünəcəklər. Mətn rus dilində kodlaşdırılıbsa, müvəffəqiyyət təmin edilir.