1234567890 1234567890 1234567890 . 123
абвгд еёжзи йклмн опрст уфхцч шщыьъ эюя
abvcdefghi . . jklmnoprst . . uqxzyw
В русском языке - всего 33 буквы ( 9 гласных и 24 согласных ),
в английском - 26. А цифр всего - 10.
Поэтому при создании математического алгоритма, переводящего слова в числа и наоборот
необходимо учитывать обратную пропорцию 10 / 33 = 0,30303.. и 33 / 10 = 3,3
http://yastro.narod.ru/a/Nw.txt Компьютер кодирует всю информацию в 2^8 = 4^4 = 16^2 = 256 символов.
(ISO-8859-5, Win-1251)
Кодирование текста.
http://www.krugosvet.ru/enc/nauka_i_tehnika/matematika/INFORMATIKA.html?page=0,3 http://algolist.manual.ru/compress/standard/arithm.php http://cah.gobb.ru/viewtopic.php?id=107 Всего в языке - около 150-300 тысяч слов, значит каждое слово можно
закодировать 6-значным числом. Хотя для нормального текста вполне
достаточно около 20-30 тысяч слов, а это - 5-значный код, который
может кодировать ровно 100 000 слов.
Примерно столько слов содержит обычный орфографический словарь.
Для создания текстов часто используют готовые конструкции из 2-3 слов - триграммы.
Возможен вариант и 3-4-х значного кодирования, но в этом случае чисел для
всех слов не хватит и придется добавлять индексы групп ( дифференцированое
кодирование ).
При этом возможно создание и сортировка групп с наиболее часто встречающимися
группами слов или объединенных по тематике и другим признакам.
Также нужно учитывать, что существует 3 рода, 6 падежей и 2 числа,
что увеличивает число производных слов примерно в 10 раз.
Кроме того есть сленг, абревиатура и т.д., что делает математическую
модель языка достаточно сложной для алгоритмизации, что можно решить методом
математических тензорных матриц.
Примерно так же работает и нейронное сознание человека.
5-значное кодирование - наиболее распространено при шифровании текстов.
Таким образом, имея таблицу слов с числовыми значениями мы можем
закодировать почти любой текст, но при создании алгоритма кодирования
жесткая привязка чисел к словам может создать некоторые проблемы при
генерации и форматировании готового текста.
Так как в языке лингвистические и фонемные связи часто бывают многозначными.
Поэтому при переводе чисел в слова, при формировании текста алгоритм
текстового генератора должен создавать альтернативные матрицы слов и словосочетаний.
Системы таких лингвистических динамически связанных (адаптивных) матриц и должны
стать основой искусственного интеллекта (ИИ) будущего.
Это чем то напоминает книгу, но в которой содержание текста постоянно меняется.
Таким образом, при каждом её прочтении мы сможем менять её интерактивный сюжет.
Книга будет запоминать все возможные варианты и на их основе создавать свой новый уникальный
текст, который также можно интегрировать с базой других тематических текстов.
Например: вы придумываете сюжетную линию, а ИИ на её основе создает варианты готовых текстов.
кодирование текста -
http://yandex.ru/yandsearch?p=1&text=%D0%BA%D0%BE%D0%B4%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5+%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0&lr=193 33
3 = 35937 - число элементов базовой феномной матрицы русского языка.
Каждый элемент такой матрицы представляет смысловую группу из 1-4 букв
( из которых затем можно составлять слова ).
Например, берем любой текст:
Текст состоит из некоторого количества предложений. Одно предложение, даже
очень распространённое, сложное, текстом назвать нельзя, поскольку текст можно
расчленить на самостоятельные предложения, а части предложения сочетаются
по законам синтаксиса сложного предложения, но не текста.
Делаем из него таблицу феномов с числовыми значениями
( желательно их упорядочить по какому то признаку ):
текс=121 тек=107 сост=102 сос=101 осто=1012 тиз=112
нек=122 кот=103 тор=105 ого=106 то=017 кол=201 от=071
лич=116 екс=124 екс=121 ост=114 сто=100 тоит=115 чес=109
из=033 еко=116 ото=202 оро=212 рог=113 оли=117 иче=118..
Имея такие таблицы, мы можем конвертировать числовые ряды в слова.
При этом можно использовать различные методы интегрального и матричного кодирования.
То есть для определенного ряда мы вычисляем наиболее читабельные значения кодов феномов.
Затем методом последовательных преобразований и замен - получим готовый текст.
Насколько он будет связанным зависит от алгоритма кодирования и формирования
структуры предложения. Для создания нормальной структуры предложения достаточно
6-12 базовых словесных матриц отсортированных по основным фонемным и лингвистическим признакам.
Например: 1-Я 2-делаю 3-такое 4-это 5-там, 6-только 7-когда 8-может 9-произойти 3-такое 4-то.
Затем создаём 9 матриц (для начала) из слов и случайным (или не совсем) образом создаем выборки
из этих матриц слов (или словосочетаний), формируя перестановками готовые конструкции предложений
(на свой вкус..) Чем больше таких конструкций, тем более сложным и красочным получится текст,
хотя уже около 10-20 типов предложений хватит для несложного по стилю текста.
Самое сложное - это создание матрицы текста, ведь предложения тоже должны быть связаны..
Хотя что то при достаточно большом массиве данных можно сделать вручную..
Также можно создать программу, которая будет анализировать уже написанное и на основе этого
генерировать новые конструкции и пополнять, таким образом свою стилистическую базу (как ребенок).
Причем всё это достаточно легко делается на обычном Бейсике или Visual Basic - вариантов много.
Также могут быть полезны различные программы оперирующие словесными базами данных.
3-буквенные слого-матрицы
( еcе сес ест сте сет )
аб аба абе або аби абу абы абр абc
ав ава аве аво авт ави аву авы авя
аг ага аге аго аги агу агы агя агю
ад ада аде адо ади аду ады адя адю
аж ажа аже ажо ажи ажу ахе амя амю
аз аза азе азо ази азу азы азя азю
ак ака аке ако аки акр аку акы акя
ал ала алг але ало али алу алы аля
ам алю алк ама аме амо ами аму амы
ан ана анг ане анд ано ани ану аны
ап апа апе апо апр апи апу апы апя
ар ара аре аро ари арм ару ары аря
ас аса асе асо аси асу асы ася асю
ат ата ате ато ати ату аты атя атю
ай аню ант апю аст ать аня ася акц
аф афа афе афо афр аль арт тра
ах аха ахе ахо ахи аху ахы
ац аца аце ацо аци ацу ацы
ач ача аче ачо ачи ачу
аш аша аше ашо аши ашу
ба бав баг бад баж баз бак бал бам бас
бу бан бап бар бас бат баф бах бац бач
бе беб бев бег бед беж без бек бел бем
бы бен беп бер бес бет беф бех бец беч
бо боб бов бог бод бож боз бок бол бом
би биб бив биг бид биж биз бик бил бим
бон боп бор бос бот боф бох боц боч бош
бир бис бир биф бих биц буд баш беш
био быт бал бак боз бет бер бар бег
бес бок бод бах бад бун бан без был быч
ва ваш вза вот вес вер вас вид вит вир
во вок век ват выд вел вен вер вил выс
ве вор ван вак вам вет вре вед вос воз
ви выс все вон вол вой веж вез вуз вей
вос вот вря вли вис вин вим вик вих виз
гра год гид ген гор гас гал гол гам
гон гад гер гос гак гав гет гел гла
гот гле гря гре гео гли гре гру гро
гип гин гир гис гес гам гон гул гуд
дан дай дас ден док доп дор для дей
дем дек дел дот дру дро дам дач дом
дес дет дер дон дух дат дос дар дел
дик дис дон дам дар дол доч дой дов
дал дар дам дак дир дил дим
его ест еле ела ено ева ере еда едо
еве ени ель есл еде ент ело ели
жит жиз жет жес жен жук жел жем
жда жал жер жев жат жар жут жул
жиг жив жил жид жир жек жик жол
зак зар зам зад зря зре зав зан
зве зем зде зло зим зна зод зон
зен зер зев зет зел зор зан зам
зво зда зат зов зак зас зей
иди идо иде или изу изо ини ине
име инт ить итс икс ист ила иле
ира ире иго ико ика ику ике ики инф
ина игл игр ига ире ито ибо иво ижо
ихо ино ина изе ита иза иса исо
каш киш кин кил ком кид коб
кос кот кто кар кот кон кит кат кан
кор кол кас ков каз ким коз кор кто
кол кат кус куч кис кар кро кур кум
кул кен кег кон кан как кал кир кер
кем ков кра кел код кос кам кле кре
лат лес лем лие лик лид лон лег лог
лов лод лет лоб лен лар лун лер лин
лож лок лиз лер лет лев лич лия лет
лип лом лос лил лен лиг лед лес леп
лег лог лев лек лох
мое мес мат мос май мил мир миг мис
мне мас мар мон мет мим мин мит
моз мор ман мас мес мер мед мод мен
муз мар мыс мак мех мот мно меж мох
мог мек маз мам мат мах мок мол мож
мой моя мов моз мел мыс мыл мел
нот нам ном низ нез нет нер нау ник
нес над наз нос нов нек нон нок ная
нед ныс нос най ниг ноз ной ный ном
нит ним низ нор нат нар нас нак нек
нол нот нео нир ник ной нец нод нав
ниа наи нол наш ние нет нал нев нел
нем ней ный нии ным нах
на но не ну ни он их им
они она оно орг оне обе осо око онк
ост орт ого опе осо осн ова орм оме
оги оле орт окт опо оди ола ода охо
ове опр отл оры ова обо око ока оле
пра про пал пам пен пол при пик пис
пир пин пил пас под пла пан паз пак
пат пар пор пот пос пон пов пох поз
пог пом пам пар пол паз про пре пер
под пок пру пон пел пен при пят пла
поз пис пра пот пле пул пле пех пин
пус пек па
рав рад ряд ред рам раз рат рас рок
роз рон рен рит рет рук рос рот рим
род ран рас рек рег рел рей рем рез
ров рог раг руг рул рус рут рум рей
реа рех рев
сис сол сет сов сод сен сел сек себ
сей сло сил сле сок сом сем сег сыл
сам сан сор сох соп сап сто сме соф
сад спо соб сло ств сор сбы сое сой
саб сер сал сар син сиг сит сих сня
сяк сюд све сре сде смо сбо сон сот сяд
так там тат тон тик тра тро три тен
тек ток тел тем тот тум тор тер тие
тив тир тем тол том тес тул тар таз
тос тог тов тис тех тал тож тут тег
тов тем тре тон там туп тин тет тед
тра тле тла тло тлу тли тур тук
то та те та
уже уде уго ура уда ума уле уро удо
узо ухо уме уса уст ум ура утр уве
фор физ фил фар фин фир фис фас фес
хот хол хор хим хос хла ха хит ход
хоз хил хам хар хав
чес чет чел чек чер чем чей чад чал
чис что чех чай чез чин чур чуд чер
чен чит час чте чир чих чиз чем чед
ших шес шло шел шер шам шот шум
цес цар ция цен цел цит цер цех цер
циа цир цим цил цой цап цум
это эти эта эра эро эри эле эло элт
эла энц энт эрм эво эх эту
яма язы яст яна ярк ялт ял ян як
яна пеш жен ефо пох вот ехе ваб осо
баз она фор опо точ аге деч изм иро
тан оюс имо мат едо так охо теф ига
чиж епа жив ихо уча жеч лых хел жип
ово фаз кед чих поч дар пож кив охи
мив сын сар беж иск аде дик ето сат
еле час обе юка схе паз фол ече пог арф акв
они хеч ива сив ибо оде зит соз мел еча лед
ихо фав час газ ева бик ава пор еки рец мон
аза цен ели ере фен нех ими зон тно зат ечи
ноз лез пон жар ави коч лож ала дюз езо тфа
чек аст ост наг мет зра юра щев гур вче нис
омо сою нор сеп кас бас реп пог езе фим ифа
хат ито бел ели гез оме дек ича моф тик аре
ром обо жал ита цир мач еди рат жре ула бер
ало дец лиз ило жиг ути доз раж ищи жен опт его
пов иде каф ами хил вов ибо для тон лех мод кос
нар лес име зиг аме сит озе паз ато фев ома лок
сог аюм чеб ене жез ино что коч кох зет сис осе
кло уто жер вса рен нол лат фом ири лез тод ржи
кит гач оче оча бок ифе фиб есо ипе лит пах ире
тог осо бис апе таж фал обо бег чин чиж ега фаг
ова дес ено зоп или яза бож оде зоч ежо жеб ака
мот сез ири бим оха юда хоч гал опа жок ефа жон
ярк нас оте док ачи даз ажо пез аге сор охи гор
ита иже узи фиг иес елю ано сип исе сол оно опа
ахо поф исо чик азе год ола сид опе жан вах мич
ити гис хов асо тед алю род это кос оре жап еро
лок ток бек пин рис гат рил нон мач аме цит зев
нес рос рож кож ряд одо пон тек век ока пел фем
ихе поп кос чер вер тем дан жиз лоз миз дин дет
да нет или вот тем тот на за эх но по да до то
про гра мат раз вит ияч ело веч ест вас рон
вяз ана соз вез дно мар три цей кос мос ама
или эле мен тар ных ква нто вых час тиц сол
мал вот дел жив ром тас име сам лот ист ори
тав ний тор жес тве нон вот итс нет мой
что ска яте яти чел ове кар тор ого
тел нес сре дин жис ных им тру мыт обя
мно гим вот нем уго ить ибо про изо чег
вес его хот вот соз нас нии сов рем
бот аза сло нил асо ное сти дис роп
уло сом при чем нас тол как что ист
ало впо лне ком пет ный нап иса тор
нед вно вы сво ей кни где мир игр атр
осн овн мая пуб лик аци вов сле нау
чно есл ист год лиш пол ули тер фан
сам авт оро про фес сор лен тай на
вот выс каз але мне ние отр тан
что не буд рат ред сит иде роп уло
сас так ост гон лиш осо кой мыс ли
ког дан ебо лес шая гру пат рон
омо нял ась кот оро точ ные нау
ким ник ног да нос отн оси лис
сер зно одн ист чит ают что ля при
нял в тот чем не при дал зна чен но
сам авт сор иде вид руг кач
еже счи тас чет вле выв ель на чис
тую вод тес тво зна ним мыс лоп
ута спе кул мят ивн ост лью око
лон нау ого чем лос ств ова ния тол
сто раз нор чив вые суж ден лия вын
уже даю три мен вне сти ве это
воп рос ост то и пос тар сде лат
поп мер сил пул вос зан има
дор пос иди точ чем код бог что она тот
быт это так кот они чел оди вре дом раз
кто лес тол сво сто для уже мам мас мат
сле зна мос гре где нет вод вер дам тка
мой сам вед дер вет зем лет под пре род
пер вот рус сме там том тем при дур дре
как выс или дум зар пла ина чем что тре
его ясн зде сон был тех они вид гла рон
ели мыл зна лем точ пот сок жив той вод
она тон нет хот сел чис год лон лин гло
себ каж кре ста род кла мир кос сам оле
над мес топ одн сол нец рос ход руд леч
зем лас наш мод мож тет быт чел тов лек
гео тев мен или мет яви тон мыс тож мер
лар быт тен вто зде ось тел кор сил тие
ода мра сын год вет гел вед лев мро мер
там дел сев чел лес рус дан нет нам тер
ест два три око все рот гол без тик гла
мам дно ден све тен наш ого рук рос сор
про тво кто тес пес спа рев пак кас пос
дал ман мре сто лет ден вос ток вид дет
вел гон сам яйц игл вас клу рол свы вам
нем над бык жен тал отк соз мон ими они
она пих дол лям при еле око лов доз над
жом нот нос пра вез пор рав дар ист пол
око еси лит сел лес лил лог был мне мог
миг име лам огр тол кол тог дай ког три
даш был мол ном оже тим ряд рек мяч меч
или том той тог ото муж бал реб наш оди
ему гло дер веп вес век сва сум кат два
вар сем вса гос лов ола окт сло ген язы
сол ант пок зан сис аст док мел лик кес
яст час ать обе кат рем нек лог сде лед
про пав лен ект кон леч нов воз дух тол
ваш вза вас вид вит вир вле кро сер сва
вок век ват выд вел вен вил све кни див
вор ван вак вам вет вед вос воз кин кно
сво вла вон вол вой веж вез вуз вей коп
вос вот вря вли вис вин вим вик вих виз
гра год гид ген гор гас гал гол гам смо
гон гад гер гос гак гав гет гел гла нов
гот гле гря гре гео гли кер гру гро вег
гип гин гир гис гес гам гон гул гуд пин
дин дай дас ден док доп дис для дей неп
дем дек дол дот дру дро дач бре бро сме
дес дет дер дон дух дат дос рад дел иде
дик дис дон дру дол доч дой дов кво хол
дал рис дак дир дил дим зас зей мле хле
еда еле ела ено ева ере еда едо све чер
еве ени ель есл еде ент ело ели лет хра
жит жиз жет жес жен жук жел жем ров кру
жда жал жер жев жат жар жут жул гли неч
жиг жив жил жид жир жек жик жол тер реч
зак зар зам даз зря зре зав зан ато тел
зве зем зде зло зим зна зод зон боз бок
зен зер зев зет зел зор зан зам зва зво
зво зда зат зов зал зре зме
ник нол мол рек гор рад роз рем рел
дай дас нед док доп для дей гро кус рак
дем дек лем дот дру дро дач пра гля ран
мое мес мос май мил мар миг мис кло рав
мне мас мар мон мет мим мин мит лат тра
моз мор ман мас мес мер мед мод мен зен
муз мар мыс мак мех мот мно меж мох тит
мог мек маз мам мах мок мол жле леж выв
мой моя мов моз мел мыс мыл мел тен слу
нот ним ном низ нез нет нер нау зин чай
дез деж чек чег чев чит тих тир рит тро
дви вид вде веб бес бер сби сми сти ста
кит тки нял вно вон
end
б=3 бед 2 6 5 =13 .. p =60
б=3 бес 2 6 19 =27 .. p =228
б=3 бел 2 6 13 =21 .. p =156
б=3 бог 2 16 4 =22 .. p =128
б=3 баг 2 1 4 =7 .. p =8
б=3 бег 2 6 4 =12 .. p =48
б=3 боб 2 16 2 =20 .. p =64
б=3 бор 2 16 18 =36 .. p =576
б=3 бон 2 16 15 =33 .. p =480
б=3 бок 2 16 12 =30 .. p =384
б=3 бот 2 16 20 =38 .. p =640
б=3 бос 2 16 19 =37 .. p =608
б=3 бар 2 1 18 =21 .. p =36
б=3 бат 2 1 20 =23 .. p =40
б=3 бас 2 1 19 =22 .. p =38
б=3 бал 2 1 13 =16 .. p =26
б=3 бак 2 1 12 =15 .. p =24
б=3 бан 2 1 15 =18 .. p =30
б=3 вор 3 16 18 =37 .. p =864
б=3 вон 3 16 15 =34 .. p =720
б=3 вот 3 16 20 =39 .. p =960
б=3 век 3 6 12 =21 .. p =216
б=3 вес 3 6 19 =28 .. p =342
б=3 вел 3 6 13 =22 .. p =234
б=3 мир 14 10 18 =42 .. p =2520
б=3 миг 14 10 4 =28 .. p =560
б=3 мил 14 10 13 =37 .. p =1820
б=3 мел 14 6 13 =33 .. p =1092
б=3 мер 14 6 18 =38 .. p =1512
б=3 мех 14 6 23 =43 .. p =1932
б=3 мат 14 1 20 =35 .. p =280
б=3 мал 14 1 13 =28 .. p =182
б=3 мах 14 1 23 =38 .. p =322
б=3 маг 14 1 4 =19 .. p =56
б=3 май 14 1 11 =26 .. p =154
б=3 мак 14 1 12 =27 .. p =168
б=3 сел 19 6 13 =38 .. p =1482
б=3 сев 19 6 3 =28 .. p =342
б=3 сек 19 6 12 =37 .. p =1368
б=3 сто 19 20 16 =55 .. p =6080
б=3 сон 19 16 15 =50 .. p =4560
б=3 сор 19 16 18 =53 .. p =5472
б=3 пас 17 1 19 =37 .. p =323
б=3 пар 17 1 18 =36 .. p =306
б=3 пал 17 1 13 =31 .. p =221
б=3 пол 17 16 13 =46 .. p =3536
б=3 под 17 16 5 =38 .. p =1360
б=3 пот 17 16 20 =53 .. p =5440
б=3 или 10 13 10 =33 .. p =1300
б=3 ими 10 14 10 =34 .. p =1400
б=3 иди 10 5 10 =25 .. p =500
б=3 ищи 10 27 10 =47 .. p =2700
б=3 ибо 10 2 16 =28 .. p =320
б=3 иго 10 4 16 =30 .. p =640
б=3 наш 15 1 26 =42 .. p =390
б=3 нам 15 1 14 =30 .. p =210
б=3 нас 15 1 19 =35 .. p =285
б=3 над 15 1 5 =21 .. p =75
б=3 нос 15 16 19 =50 .. p =4560
б=3 нет 15 6 20 =41 .. p =1800
б=3 так 20 1 12 =33 .. p =240
б=3 ток 20 16 12 =48 .. p =3840
б=3 кот 12 16 20 =48 .. p =3840
б=3 как 12 1 12 =25 .. p =144
б=3 кто 12 20 16 =48 .. p =3840
б=3 тот 20 16 20 =56 .. p =6400
б=3 лес 13 6 19 =38 .. p =1482
б=3 лет 13 6 20 =39 .. p =1560
б=3 лен 13 6 15 =34 .. p =1170
б=3 лев 13 6 3 =22 .. p =234
б=3 лед 13 6 5 =24 .. p =390
б=3 лег 13 6 4 =23 .. p =312
б=3 год 4 16 5 =25 .. p =320
б=3 гол 4 16 13 =33 .. p =832
б=3 гоп 4 16 17 =37 .. p =1088
б=3 гон 4 16 15 =35 .. p =960
б=3 гор 4 16 18 =38 .. p =1152
б=3 гот 4 16 20 =40 .. p =1280
б=3 дев 5 6 3 =14 .. p =90
б=3 дел 5 6 13 =24 .. p =390
б=3 дед 5 6 5 =16 .. p =150
б=3 дом 5 16 14 =35 .. p =1120
б=3 дон 5 16 15 =36 .. p =1200
б=3 дол 5 16 13 =34 .. p =1040
б=3 два 5 3 1 =9 .. p =15
б=3 дал 5 1 13 =19 .. p =65
б=3 дар 5 1 18 =24 .. p =90
б=3 дан 5 1 15 =21 .. p =75
б=3 дам 5 1 14 =20 .. p =70
б=3 дай 5 1 11 =17 .. p =55
б=3 уже 21 8 6 =35 .. p =1008
б=3 угу 21 4 21 =46 .. p =1764
б=3 ура 21 18 1 =40 .. p =378
б=3 ума 21 14 1 =36 .. p =294
б=3 ухо 21 23 16 =60 .. p =7728
Генератор слов -
http://rajaka.narod.ru/generator/m_generator.html