?

Log in

No account? Create an account

Previous Entry | Next Entry

Condit ar owes amplet

http://www.translatish.com/

Это ведь код, не язык? Слова почти не повторяются. Там такого текста целый здоровенный веб-сайт. Большинство из длинных «слов» больше нигде в сети не встречаются.

Ermim cubes progsez uns ceux bastua

Willuns til toisab witsie [micmark ties], narin siman nuriz dad boteur fod. Ned i kli edia gete kuk mann mendit suchown cin (geantir willuk). Satzop furcom beenlui nohue liarkin; net cialer pasmit ven ral ke gedis mefer ga cuarse arloinum ri deuthe anson sel moc port zeigt rungal velmay been enlio herdic mequi aun gikrup backent bailet wes klungas fontans paisdu. Ria rowent foga li nersuc kla fragi her pamit ousuch les ject et restin selfen enjekt reesem seem ban proachec vonres.

Quand ris uvb ain tasec miem plus stonion pergut omal way cola zis yearsis fuhcei con not yu dent decmad rernom cub foundai doef pleabad; guneast deut galres pointar monleg (&) auga four wellaf resmen chaus du supob fourpon sesfun delop. Boymar wor drenber miosualkunhun var klungis (&) hasto fin gru nomag prob deedbun ruargar. Cuad bes el {gar} burgup mievion main moform yik homfit genmer tutzug vion cermem fra vez serju frane fangu hunach tua sep mesei mij, firpeup stugirl zum sisor caingou nienag ont hua 55 gapren portim mentob totrio duebest sesou fach. Xisga vordonc gie lo kup tigeb, bildun mo doses aican hier sort {los} full pacan, cuicier mac duc hom gruplong gualiar tiocour bieree ciwith zul golcoc both feodown efwur sawgion ai.


И так далее… Статистика первой страницы:

Total words: 1987
Unique words: 1810
Score: 91.1%
Words and frequencies:
1. a 7 0.4%
2. ra 6 0.3%
3. cub 4 0.2%
4. li 4 0.2%
5. los 4 0.2%
6. re 4 0.2%
7. ver 4 0.2%
8. an 3 0.2%
9. ba 3 0.2%
10. buen 3 0.2%
11. cam 3 0.2%
12. ce 3 0.2%
13. dent 3 0.2%
14. des 3 0.2%
15. duc 3 0.2%
16. er 3 0.2%
17. im 3 0.2%
18. les 3 0.2%
19. let 3 0.2%
20. liar 3 0.2%
21. met 3 0.2%
22. moc 3 0.2%
23. ne 3 0.2%
24. ni 3 0.2%
25. pe 3 0.2%
26. ria 3 0.2%
27. to 3 0.2%
28. tts 3 0.2%
29. zul 3 0.2%
30. ag 2 0.1%
31. ain 2 0.1%
32. ar 2 0.1%
33. au 2 0.1%
34. ber 2 0.1%
35. bild 2 0.1%
36. bom 2 0.1%
37. bor 2 0.1%
38. cain 2 0.1%
39. chef 2 0.1%
40. cic 2 0.1%
41. cir 2 0.1%
42. co 2 0.1%
43. com 2 0.1%
44. con 2 0.1%
45. coup 2 0.1%
46. cu 2 0.1%
47. cul 2 0.1%
48. dann 2 0.1%
49. den 2 0.1%
50. der 2 0.1%
51. di 2 0.1%
52. dia 2 0.1%
53. doing 2 0.1%
54. don 2 0.1%
55. ei 2 0.1%
56. en 2 0.1%
57. felt 2 0.1%
58. fur 2 0.1%
59. ga 2 0.1%
60. gai 2 0.1%
61. gal 2 0.1%
62. gar 2 0.1%
63. gual 2 0.1%
64. halt 2 0.1%
65. help 2 0.1%
66. her 2 0.1%
67. hes 2 0.1%
68. hin 2 0.1%
69. i 2 0.1%
70. int 2 0.1%
71. klich 2 0.1%
72. lo 2 0.1%
73. long 2 0.1%
74. lue 2 0.1%
75. main 2 0.1%
76. mal 2 0.1%
77. mee 2 0.1%
78. mehr 2 0.1%
79. ment 2 0.1%
80. mo 2 0.1%
81. muy 2 0.1%
82. ner 2 0.1%
83. net 2 0.1%
84. new 2 0.1%
85. non 2 0.1%
86. our 2 0.1%
87. pa 2 0.1%
88. pes 2 0.1%
89. pos 2 0.1%
90. pou 2 0.1%
91. pour 2 0.1%
92. prit 2 0.1%
93. qui 2 0.1%
94. quic 2 0.1%
95. ral 2 0.1%
96. reit 2 0.1%
97. ren 2 0.1%
98. sa 2 0.1%
99. see 2 0.1%
100. sel 2 0.1%
101. ser 2 0.1%
102. sir 2 0.1%
103. six 2 0.1%
104. sol 2 0.1%
105. sort 2 0.1%
106. stel 2 0.1%
107. sun 2 0.1%
108. tab 2 0.1%
109. tan 2 0.1%
110. tar 2 0.1%
111. taz 2 0.1%
112. te 2 0.1%
113. tes 2 0.1%
114. this 2 0.1%
115. tho 2 0.1%
116. ti 2 0.1%
117. ties 2 0.1%
118. til 2 0.1%
119. tio 2 0.1%
120. told 2 0.1%
121. tout 2 0.1%
122. tral 2 0.1%
123. tre 2 0.1%
124. tua 2 0.1%
125. ven 2 0.1%
126. vion 2 0.1%
127. vo 2 0.1%
128. ward 2 0.1%
129. was 2 0.1%
130. wer 2 0.1%
131. wit 2 0.1%
132. wor 2 0.1%
133. year 2 0.1%
134. yu 2 0.1%
135. zeigt 2 0.1%
136. zon 2 0.1%

Остальных по одному. Что за чудеса? Если это код — надо разгадать!

Comments

( 54 comments — Leave a comment )
schegloff
Mar. 1st, 2011 05:36 pm (UTC)
Круто
Слова-то как настоящие. Отличный генератор забытых языков. Как работает, подробно описано на сайте, вот только одна беда - на уже транслитерированном с английского :)

Может эта страница поможет найти декодер? http://www.translatish.com/framcal/velyart.html
fregimus
Mar. 1st, 2011 07:19 pm (UTC)
Re: Круто
Мне пока не помогла.
garvey_r
Mar. 1st, 2011 05:51 pm (UTC)
Вот тут обсуждалось
http://dis.4chan.org/read/lang/1269042464&r

большая часть мнений - бред, подделка.
fregimus
Mar. 1st, 2011 07:20 pm (UTC)
Мнений у меня самого как минимум пять разных, больше уж, кажется, и не надо…
(Deleted comment)
fregimus
Mar. 1st, 2011 07:21 pm (UTC)
Хорошая идея. А какие именно языки? Узнаете слова?
(Deleted comment)
(no subject) - iad - Mar. 1st, 2011 10:15 pm (UTC) - Expand
(no subject) - sepulkarium - Mar. 1st, 2011 08:19 pm (UTC) - Expand
(no subject) - antihydrogen - Mar. 2nd, 2011 09:38 am (UTC) - Expand
(no subject) - fregimus - Mar. 2nd, 2011 09:39 am (UTC) - Expand
(no subject) - antihydrogen - Mar. 2nd, 2011 09:55 am (UTC) - Expand
(no subject) - fregimus - Mar. 2nd, 2011 10:04 am (UTC) - Expand
(no subject) - (Anonymous) - Mar. 2nd, 2011 10:53 am (UTC) - Expand
(no subject) - fregimus - Mar. 2nd, 2011 11:15 am (UTC) - Expand
janatem
Mar. 1st, 2011 06:04 pm (UTC)
Это задача из серии «угадай, что угадать надо»?
Там есть ссылки на страницы, содержащие «переводы» предложений на английский.
fregimus
Mar. 1st, 2011 07:21 pm (UTC)
Хуже того — неизвестно даже, надо или не надо.
"neeter rent car" - brewbuilder - Mar. 1st, 2011 07:23 pm (UTC) - Expand
Re: "neeter rent car" - fregimus - Mar. 1st, 2011 07:25 pm (UTC) - Expand
Re: "neeter rent car" - brewbuilder - Mar. 1st, 2011 07:31 pm (UTC) - Expand
slobin
Mar. 1st, 2011 06:22 pm (UTC)
Единственное осмысленное обсуждение загадки мне удалось найти здесь. Остальные десятки тысяч ссылок -- роботы, ворующие контент друг у друга. Подозреваю, они и были целевой аудиторией.

... The hinge of armoring is important internal source ...

fregimus
Mar. 1st, 2011 07:23 pm (UTC)
Я бы не стал столько трудиться, чтобы роботов подивить, чесслово! Думаю, смысл должен быть.
aamonster
Mar. 1st, 2011 06:36 pm (UTC)
Не знаю, что это, но подмывает сделать такую бяку:

1. Берём текст на английском, считаем условные вероятности символов в двухбуквенном контексте (типа вероятности буквы "р" после букв "ве").
2. Генерим по этим вероятностям текст (первые две буквы случайно, третью - случайно по вероятностям из пункта 1 и так далее).
3. Выкидываем из полученного текста все английские слова.

Таким образом, звучать будет похоже на английский - но без известных слов.
fregimus
Mar. 1st, 2011 07:23 pm (UTC)
И зачем мы все это проделываем?
(no subject) - aamonster - Mar. 1st, 2011 07:36 pm (UTC) - Expand
(no subject) - thedeemon - Mar. 2nd, 2011 06:22 am (UTC) - Expand
(no subject) - fregimus - Mar. 2nd, 2011 07:09 am (UTC) - Expand
(no subject) - antihydrogen - Mar. 2nd, 2011 09:40 am (UTC) - Expand
spamsink
Mar. 1st, 2011 07:12 pm (UTC)
Я бы предположил, что слова выбираются случайно из всего корпуса интернета - поэтому повторения хоть и есть, но их мало, а используются ради значений конкретных байтов (или битов) своих хешей (CRC32, MD5, SHA*, да мало ли их). Вычислив известные хеши и выбрав из них нужные биты, получим исходный стеганографированный текст.
fregimus
Mar. 1st, 2011 07:24 pm (UTC)
Но разгадать-то его в таком случае нельзя. Это было бы ужасно неинтересно.
(no subject) - spamsink - Mar. 1st, 2011 07:35 pm (UTC) - Expand
(no subject) - fregimus - Mar. 1st, 2011 07:40 pm (UTC) - Expand
(no subject) - aamonster - Mar. 1st, 2011 07:40 pm (UTC) - Expand
(no subject) - aamonster - Mar. 1st, 2011 07:48 pm (UTC) - Expand
(no subject) - iad - Mar. 1st, 2011 08:43 pm (UTC) - Expand
(no subject) - aamonster - Mar. 1st, 2011 09:31 pm (UTC) - Expand
(no subject) - fregimus - Mar. 2nd, 2011 02:28 am (UTC) - Expand
(no subject) - iad - Mar. 2nd, 2011 05:21 am (UTC) - Expand
(no subject) - slobin - Mar. 2nd, 2011 12:23 pm (UTC) - Expand
(no subject) - fregimus - Mar. 2nd, 2011 01:01 pm (UTC) - Expand
met0
Mar. 1st, 2011 08:45 pm (UTC)
Новый синтетический язык? :) Помнится, в моем детстве по телевидению шел спектакль о том, как молодой человек выучил неизвестный ему язык, пользуясь услугами безумного преподавателя, который потом исчез. И юноша никак не мог найти, что это был за язык, пока не столкнулся с человеком, который тоже его знал. Он выучил его по самоучителю с оторванными обложкой и первыми страницами.
fregimus
Mar. 2nd, 2011 02:29 am (UTC)
Отличный сюжет!
(no subject) - antihydrogen - Mar. 2nd, 2011 09:48 am (UTC) - Expand
sepulkarium
Mar. 1st, 2011 09:16 pm (UTC)
Там снизу адрес указан: info@translatish.com
Можно написать гневное письмо
fregimus
Mar. 2nd, 2011 02:30 am (UTC)
На каком языке?
goth_tucha
Mar. 2nd, 2011 02:24 am (UTC)
Похоже на дизайнерскую "рыбу" а-ля Lorem Ipsum. Может быть сайт в разработке?
fregimus
Mar. 2nd, 2011 02:31 am (UTC)
По крайней мере два года. И еще это: http://fregimus.livejournal.com/142467.html?thread=3782275#t3782275
(no subject) - goth_tucha - Mar. 2nd, 2011 07:45 am (UTC) - Expand
abzac_kakoj_to
Mar. 2nd, 2011 08:37 am (UTC)
1. Когда люди ищут что-то в гугле, они иногда опечатываются
2. При этом с ненулевой вероятностью получаются такие слова
3. При этом они попадают на этот сайт
....
5. Profit
fregimus
Mar. 2nd, 2011 09:36 am (UTC)
А какой от попадания на сайт профит? По-моему, расход один. Один мегабайт — двадцать копеек, пять мегабайт — рубль…
(no subject) - abzac_kakoj_to - Mar. 2nd, 2011 10:21 am (UTC) - Expand
(no subject) - slobin - Mar. 2nd, 2011 12:16 pm (UTC) - Expand
afuchs
Mar. 2nd, 2011 10:24 am (UTC)
Там, как заметили выше - множество слов из известных языков (нем., англ., франц., галл.); я думаю, это орфографические и каким-то образом синтаксические анаграммы. Т.е. взяли много переводов на разные языки, например, с гугла, и каким-то более или менее хитрым скремблером их перемешали, да так, чтобы распространённые статистические системы распознавания языков показывали высокую информативность (или как это там называется).
fregimus
Mar. 2nd, 2011 11:14 am (UTC)
Они ее как раз не показывают. Закон Ципфа очевидно не выполняется для этих текстов.
( 54 comments — Leave a comment )