Мой комментарий к записи «Что в имени твоём: Свобода» от viakviak в lengvizdika

"...Вы играете в слова. Это наукообразное творчество. Да на здоровье, но оно не имеет никакого отношения ни к науке, ни к играм. Для науки у вас нет никакой логики, а для игр нет никаких правил."

Нет логики? Позвольте сначала немного о себе. Я по образованию инженер многоканальной электросвязи, но работаю программистом очень много лет в крупнейших компаниях мира, т.е использую формальную логику в каждодневной работе. Вернемся к этимологии. Да, я не специалист по натуральным языкам и не имею формального линвистического образования. С другой стороны т.к. я программист, то изучал много разных языков программирования.
Здесь я поставил перед собой целью изучить один достоточно простой формальный подход слово-образованию, с которым я вас и познакомил.

Какие характеристики слов мы знаем? Во первых, это Смысл слова - это понимание термина, означающего предмет, процесс, характеристику, отношение и пр. Во вторых, это - Звучание (фонетика) слова, означающего как слово издается и воспринимается в непосредственном общении. Ну уже и в третьих, это - Написание слова, что является основой нашей цивилизации.

Я рассматриваю известные мне языки (русский, английский и совсем чуть-чуть узбекского) как огромную базу данных в которой собраны слова разных языков. Посыл заключается в том, что слова образовывались и использовались долгое время людьми без всякого образования, т.е. законы словообразования должны быть очень просты и доступны любому носителю языка. Представляется логичным, что любое новое понятие будет описано словом, которое указывает на основную характеристику этого понятие. Человек-автор будет обращаться к своему опыту и путаться озвучить новое понятие похоже на уже известные, чтобы передать их общность. Если это так, то мы должны видеть огромное количество близких по смыслу и звучанию слов на совершенно разных языках. Если посыл не правилен, то слова будут практически не связаны с другими, понятия и звучание будут случайными.

Я с удовольствие прислушиваюсь к критике, но т.к. очень многое не учитывает специфики моего исследования, то одним из главых принципов для меня здесь является отрицание ЛЮБЫХ авторитетов. Это помогает сконцентрироваться на внутренней логике и не останавливаться на пол-пути. Я выбрал формат "этимологический словарь" как наиболее подходящий для исследования т.н. "графа слов и их связок". Каждое статья посвящена единственному слову (вершина графа), содержит титул, краткое преположение (summary), описание (description) и ссылки на источники, включая ка внесние, так и предыдущие статьи. Идея в том, чтобы набрав необходимую сложность и связность попытаться обработать результат с помощью формальных алгоритмов, доступных Искуственному Интелекту, например. В настоящее время у меня всего 2636 статей разного качества, которые оформлены пока как скрипт XML документов в MS SQL Server database для поддержки поиска. Я публикую статьи в Ленгвизде, т.к. здесь я получаю столь небходимую конструктивную критику, новые идеи и моральную поддержку. В это же время я добавляю новые статьи и исправляю старые в своем журнале.

Естественные науки как биология, например, были созданы на основе категоризации данных. Именно система категоризации и составляет сущность этих наук. Почему бы не попробовать категоризацию слов и связей между ними основанную на формальных критериях и экспертных оценках?

Благодарю Вас за то, что потратили ваше время, чтобы составить свое мнение. Надеюсь, что со временем вы сможете изменить его в лучшую сторону.

Посмотреть обсуждение, содержащее этот комментарий