Страница 2 из 2 ПерваяПервая 12
Показано с 21 по 34 из 34

Тема: Библиотека буддийских текстов и перевод Канона

  1. #21
    Участник Аватар для Центр Риме
    Регистрация
    18.05.2014
    Традиция
    традиция Риме
    Сообщений
    81
    О переводах.
    Основной задачей разработки программного обеспечения для перевода является снижение себестоимости затрат.
    На долю человека должна остаться литературная обработка и сверка основного смысла текста.
    Такая работа как согласование падежей и пословный перевод может быть автоматизирована.
    При таком подходе во первых выигрывает общество в целом, во-вторых переводчик занят реально творческим трудом.
    Как и во все времена автоматизация девальвирует ремесленный труд. Но еще раз повторю выигрывает общество в целом.

    Что касается денег за перевод.
    Как и в случае разработки программного обеспечения вопрос по какой лицензии выполнен перевод.
    Если это коммерческая лицензия - значит это не Дхарма.

  2. #22
    Основной участник
    Регистрация
    17.05.2002
    Традиция
    Махаяна
    Сообщений
    27,693
    Цитата Сообщение от Центр Риме Посмотреть сообщение
    О переводах.
    Основной задачей разработки программного обеспечения для перевода является снижение себестоимости затрат.
    На долю человека должна остаться литературная обработка и сверка основного смысла текста.
    Такая работа как согласование падежей и пословный перевод может быть автоматизирована.
    При таком подходе во первых выигрывает общество в целом, во-вторых переводчик занят реально творческим трудом.
    Как и во все времена автоматизация девальвирует ремесленный труд. Но еще раз повторю выигрывает общество в целом.

    Что касается денег за перевод.
    Как и в случае разработки программного обеспечения вопрос по какой лицензии выполнен перевод.
    Если это коммерческая лицензия - значит это не Дхарма.
    А не задумывались о том, что автоматический перевод -- это надругательство над Дхармой? И почему "коммерческая лицензия -- это не Дхарма"? Наоборот, книги по Дхарме надо продавать, чтобы люди её больше ценили. Ведь это человеческий труд, усилия переводчиков, редакторов, корректоров, верстальщиков и издателей. Они получают от этого очень мало денег. На Дхарме мильоны не заработаешь. Вот что касается продажи древних тханок и т.п. -- совершенно другой вопрос.

  3. #23
    Основной участник Аватар для Цхултрим Тращи
    Регистрация
    11.01.2010
    Традиция
    гуруринпочизм-падмасамбхавизм
    Сообщений
    7,835
    Записей в блоге
    29
    Цитата Сообщение от Центр Риме Посмотреть сообщение
    Но еще раз повторю выигрывает общество в целом.
    Спору нет, автоматизация перевода дело важное и полезное.

    Но к сожалению, текущий уровень имеющихся программных продуктов не позволяет получить значительных преимуществ от машинного перевода. До сих пор гораздо легче переводить оригинальный текст напрямую, нежели править бессмыслицу, переведённую автоматически.

    Было бы здорово разработать CAT-систему, оптимизированную для тибетского, желательно с возможностью централизованного хранения TM, создать нормальный тибетско-русский электронный словарь, хотя бы уровня Иллюминатора Тони Даффа, а потом на этой основе уже думать над программой для машинного перевода. Но к сожалению, учитывая количество людей в русскоязычных странах, в этом заинтересованных, даже описанное —это несбыточная мечта.

  4. Спасибо от:

    Нико (20.05.2014)

  5. #24
    Основной участник
    Регистрация
    17.05.2002
    Традиция
    Махаяна
    Сообщений
    27,693
    Цитата Сообщение от Цхултрим Тращи Посмотреть сообщение
    Спору нет, автоматизация перевода дело важное и полезное.

    Но к сожалению, текущий уровень имеющихся программных продуктов не позволяет получить значительных преимуществ от машинного перевода. До сих пор гораздо легче переводить оригинальный текст напрямую, нежели править бессмыслицу, переведённую автоматически.

    Было бы здорово разработать CAT-систему, оптимизированную для тибетского, желательно с возможностью централизованного хранения TM, создать нормальный тибетско-русский электронный словарь, хотя бы уровня Иллюминатора Тони Даффа, а потом на этой основе уже думать над программой для машинного перевода. Но к сожалению, учитывая количество людей в русскоязычных странах, в этом заинтересованных, даже описанное —это несбыточная мечта.
    Очень правильно сказано. Я бы словарь Хопкинса на русский перевела, конечно, с командой. Это было бы супер полезно. За Тони Даффа тоже голосую.

  6. Спасибо от:


  7. #25
    Основной участник
    Регистрация
    25.05.2002
    Традиция
    Тхеравада
    Сообщений
    3,266
    Записей в блоге
    22
    Получение фиксированной ставки за перевод также возможно. Особенно если переводчик не буддист.
    Цитата Сообщение от Нико Посмотреть сообщение
    Почему невозможно? У издательств существует фиксированная ставка за перевод. Иногда сами переводчики назначают свою ставку. Это работа, в конце концов. Если человек -- буддийский переводчик, и ему никто не платит за его переводы, он уйдёт на другую работу, и всё.
    Нико, что-то ваш вопрос с цитатой не стыкуется.

  8. #26
    Основной участник
    Регистрация
    17.05.2002
    Традиция
    Махаяна
    Сообщений
    27,693
    [QUOTE =sergey;667340]Нико, что-то ваш вопрос с цитатой не стыкуется.[/QUOTE]

    К какой цитатой? Поясните

  9. #27
    Основной участник
    Регистрация
    25.05.2002
    Традиция
    Тхеравада
    Сообщений
    3,266
    Записей в блоге
    22
    А вы сами не видите? )) Человек пишет: возможно, а вы возражаете: "Почему невозможно?"

  10. #28
    Участник Аватар для Центр Риме
    Регистрация
    18.05.2014
    Традиция
    традиция Риме
    Сообщений
    81
    По программе перевода.
    НА ПЕРВОМ ЭТАПЕ
    Собран пословный словарь на 62 тысячи слов. отредактировано около 12 000 статей.
    http://www.dharmabook.ru/edit/media/allDict_rus.txt
    На его основе работает пословный подстрочник для всего корпуса
    http://www.dharmabook.ru///CORPUS/ (для перевода текста нажать на флажок RUS рядом с названием файла)
    Править словарь можно прямо в тексте по хода процесса перевода.
    Каждое слово ведет на полный список словарных статей (около 20 словарей).
    Также с помощью Питерского Университета собран большой материал по тибетской грамматике

    ВТОРОЙ ЭТАП
    Необходимо:
    1. Продолжить редактуру словаря.
    2. Разработать способ грамматического разбора падежей и определения частей речи в предложении.
    3. Сделать полно-текстовой поиск по корпусу.
    4. Создать терминологический словарь на базе 16-ти томного санскрито-тибетского словаря Доктора Неги

    Для реализации второго пункта необходимо подробно разобрать грамматику нескольких Сутр.
    Например на примере текста Алмазной Сутры. Если кто может с этим помочь - это будет реальная и большая помощь.


    По поводу того что машинный перевод это плохо.
    Не понимать что написано в тексте - это плохо. Также очень плохо то что переведено меньше сотой процента.
    Хорошо то, что переводчик может сосредоточится на сути вопроса а не поиску по словарям и рутинным операциям.
    Реальная сложность в том, что в тибетском языке грамматика не всегда соблюдается в точности. Много сокращений,
    в поэтическом тексте строчки подгоняются в размер в ущерб грамматике. СОответственно при переводе
    часто нужно предположить гипотезу перевода, и уточнять ее по ходу перевода других предложений и подобных по смыслу фраз.

    Как основу для грамматического разбора можно взять учебник Гольдштейна и лекции Хана в переводе А.Парибка
    на их базе составили сводную таблицы грамматики с дополнительныма примерами
    Последний раз редактировалось Центр Риме; 21.05.2014 в 15:31.

  11. Спасибо от:

    Гошка (28.05.2014)

  12. #29
    Основной участник
    Регистрация
    17.05.2002
    Традиция
    Махаяна
    Сообщений
    27,693
    Цитата Сообщение от sergey Посмотреть сообщение
    А вы сами не видите? )) Человек пишет: возможно, а вы возражаете: "Почему невозможно?"
    Значит, я не так прочла, извиняюсь тогда.

  13. Спасибо от:

    sergey (21.05.2014)

  14. #30
    Участник Аватар для Центр Риме
    Регистрация
    18.05.2014
    Традиция
    традиция Риме
    Сообщений
    81
    Думаю что любое достаточно крупное общественное событие вызывает неоднозначную реакцию. В подобном положении сейчас находятся все интернет-библиотеки.
    Например:
    «Заместитель министра культуры Г.П. Ивлиев посвятил своё выступление законотворческому процессу, направленному на поиск компромисса между необходимостью расширения доступа граждан к массивам научной и образовательной литературы и требованием правообладателей на получение справедливой компенсации при цифровом копировании их работ. Речь, в частности, шла об очередных поправках в статью 1275 Части 4 ГК РФ.» статья 04.12.2012 ПОПРАВКИ В СТ. 1275 ГК РФ: БАТАЛИИ ИЗДАТЕЛЕЙ И БИБЛИОТЕК НЕ УТИХАЮТ
    http://www.copyright.ru/ru/news/main...5_popravki_GK/
    На сегодня можно отцифровывать издания изданные 10 лет назад.

    Еще раз повторю, что если есть обоснованное обращение авторов или переводчиков, то такие материалы мы удаляем.

    Если есть желание высказать обвинение или порицание, то просьбы указывать на конкретные факты. Это поможет разобраться.
    Конечно при большом желании библиотеку можно закрыть. Как впрочем и любое начинание.
    Есть ли в этом смысл для сангхи?
    В абсолютном объеме спорных материалов немного, наша идея как раз и состоит в том чтобы увеличить количество материалов свободных от копирайтов.
    Что касается исходных текстов то этот вопрос практически решается распознаванием, вопрос перевода литературной обработкой текста на основе оригинала.

    Понятно что я не ангел, но готов разбираться на основе фактов. С досточтимым Палджором мы не общались несколько лет, поэтому удивлен что у него накопилось так много претензий ко мне.
    Если с моей стороны можно как-то исправить положение то я готов. (В личку человек с личными претензиями писать не готов, а убиться головой об стену просьба не предлагать
    Последний раз редактировалось Центр Риме; 22.05.2014 в 18:38.

  15. #31
    Администратор Аватар для Ануруддха
    Регистрация
    06.05.2002
    Традиция
    Тхеравада
    Сообщений
    4,089
    Друзья, просьба личное обсуждать лично.

  16. #32
    Участник Аватар для Центр Риме
    Регистрация
    18.05.2014
    Традиция
    традиция Риме
    Сообщений
    81
    По программе словаря и переводах.
    Предлагаю продолжить обсуждение и найти общие возможности развития проекта переводов текстов и библиотеки.
    Один из вариантов создания и редактуры словаря и программы грамматики это использование движка Википедии.
    Викисловарь пали:
    https://ru.wiktionary.org/wiki/%D0%9...B0%D0%BB%D0%B8
    Не думаю что они дадут нам возможность ехпорта словаря из их базы данных. Можно будет скачать из HTML формата, но это хлопоты.

    Все словари которые мы делаем доступны в виде текстовых файлов и в формате XML
    Для редактуры словаря можно использовать программы офисных баз данных такие как Exel, Access, FileMaker
    Основное это обмен результатами работы между разными группами и переводчиками.

    По сути вопроса составления словарей. Для многих текстов употребление слов определяется контекстом и смыслом текста.
    Поэтому можно говорить о основном смысле слова и его конкретном значении в тексте.
    Для тибетского одно слова может иметь до 20-30 значений в контексте текста.
    Му предлагаем создать систему, при которой гипотезу о конкретном значении слова можно подкрепить
    грамматическим разбором и контекстом употребления этого слова в корпусе текстов.

    Поэтому порядок может быть такой.
    Мы для начала делаем пословный перевод и разбор грамматики уже переведенных текстов.
    На этой основе делае словарь и программу для перевода всего корпуса

    http://www.dharmabook.ru//ocr/ocr.ph...main_again.txt

    такой же грамматический разбор есть для пали, но словарь пока небольшой - около тысячи слов.
    Для реального результата нужно около 10 000.
    Словарь можно править непосредственно на HTML странице

  17. Спасибо от:

    Гошка (28.05.2014)

  18. #33
    Участник Аватар для Центр Риме
    Регистрация
    18.05.2014
    Традиция
    традиция Риме
    Сообщений
    81
    Буддийская библиотека

    ПРОБЛЕМА
    Одной из основополагающих задач современности является предотвращение
    проявления насилия на международном и внутригосударственном уровне.
    Запасов вооружения на земле на сегодня достаточно для того, чтобы несколько раз
    полностью уничтожить все живое на ее поверхности.
    В современных межнациональных конфликтах геноциду подвергаются целые народы.
    По разным оценкам только в России на протяжении двадцатого века от насилия, голода
    и вызванных социальными причинами болезней погибло около 120 миллионов человек.
    Это численность всего населения России в 1913 году.
    Очевидно, что конфликты в 21 веке в случае использования современных средств массового
    уничтожения унесут жизни миллиардов.
    Цифры такого рода столь чудовищны что сознание закрывает двери восприятия.
    Человек старается не думать о таких вещах. К сожалению это не помогает.
    Только все люди вместе могут решить эту проблему. Прежде всего потому,
    что ее возникновение это не злая воля отдельных личностей, а проявление базовых
    инстинктов вида Homo Sapiens - одного из самых успешных и жестоких видов на Земле.
    Для того чтобы выжить как вид, мы должны изменить основы инстинктивного поведения,
    заменить их на осознанный этический выбор.

    Одним из методов такого изменения является глобализация. Подчинение интересов малых групп интересу большинства снижает риск применения насилия в конфликтах между группами.

    Другим методом является этическое воспитание.
    Именно этика на личностном уровне определяет этический уровень государственных решений.
    История многократно доказывала, что волю народа сломить невозможно, даже поставив его на грань
    практически полного уничтожения. Эта воля является совокупностью нравственного выбора каждого человека.
    В современном мире нашим самым большими нашими врагами является невежество, геноцид, фашизм и диктатура во всех ее проявлениях, коррупция, воровство и взяточничество.
    Какой бы метод не использовался для борьбы с этими врагами, он должен привести к изменению фундаментальных этических установок каждого человека.

    Большую значение как процессах глобализации, так и в этическом воспитании имеет развитие средств связи и межязыкового общения.
    Понимание языка другого народа, знакомство с его культурой и историей помогает мирному решению
    межнациональных проблем как на государственном, так и на личностном уровне.

    ЗАДАЧА
    Главы практически всех буддийских традиций поддержали программу создания открытой буддийской библиотеки. Была поставлена задача сделать общедоступным все будийское наследие в объеме национальных библиотек Монголии, России и Индии. Общедоступность включает в себя свободное распространение и перевод на основные языки.
    Очевидно, что сама постановка подобного рода задачи возможно только в связи с развитием современных средств хранения, обработки и распространения информации.
    Глобальность проблем с которыми столкнулось человечество в 20 веке диктует также и глобальный подход к их решению.

    РЕШЕНИЕ
    Первый этап
    На первом этапе выполнения проекта создана программа распознавания восточного и иероглифического текста и собрано 12 000 книг и более 2 террабайтов медийных материалов.
    Для реализации доступа разработан и реализован проект интернет портала www.buddism.ru

    Второй этап.
    На втором этапе необходимо организовать международную программу сотрудничества и обмена фондами электронных библиотек.
    Одним из направлений проекта, который может иметь необходимую капитализацию и обладать достаточным ресурсом для решения задач второго этапа является разработка проекта искусственного интеллекта.

    Такой проект может иметь достаточную пользу для страны, чтобы получить доступ к текстам в государственных библиотеках и заинтересовать международных участников.
    Разработка искусственого интеллекта позволит также решить задачу перевода корпуса библиотеки на языки участников проекта.

    Наиболее перспективными выглядят разработка функций различения, классификации и совершенствование оптического распознавания сложных обьектов.
    Классификация взаимной смысловой связи только 20 тысяч понятий требует проверки более полумиллиарда прямых сочетаний. В реальном языке связей гораздо больше за счет учета взаимных связей трех и более понятий.
    При освоении родного языка этот процесс занимает более десяти лет.
    При изучении иностранного языка возможности образования новых связей значительно ограничены.
    При оптическом распознавания сложных обьектов, также должен выполняется объем вычислений не осуществимый при прямом сравнении с эталоном.

    Другим решением задач второго этапа может быть прямое проявление доброй воли на уровне руководителей государств, обладающих фондами буддийской литературы в закрытых хранилищах.

    ВЫГОДЫ РЕАЛИЗАЦИИ
    В первую очередь это снижение межнациональной напряженности. Его Святейшество Далай Лама получил Нобелевскую премию мира за его усилия по прекращению вооруженного конфликта между Индией и Китаем. Россия имеет самую протяженную в мире границу с Китаем - государством, язык и культуру которого мы знаем совершенно недостаточно. Достаточно упомянуть, что объем только буддийской литературы полностью неизвестный западной культуре составляет около 2 миллионов томов. Реализация проекта позволит создать базу взаимопонимания.
    Важным следствием реализации проекта может являться снижение языкового барьера и развитие средств перевода и обработки текстов.
    Последний раз редактировалось Центр Риме; 29.05.2014 в 10:41.

  19. Спасибо от:

    Гошка (28.05.2014)

  20. #34
    Участник Аватар для Центр Риме
    Регистрация
    18.05.2014
    Традиция
    традиция Риме
    Сообщений
    81
    Проект понемногу развивается.
    Установили рабочее сотрудничество с проектом www.dhamma.ru
    проект поддежал ACIP - проект созранения и изучения классических буддийских текстов.
    ACIP готов предоставить более 10 000 страниц переводов Сутр на английский язык и словари сопоставлений которые они разработали.
    На этой базе возможно проведение сопоставлений переводов словосочетаний с тибетского на санскрит, английский и русский языки.

    Также начали проведение семинаров по изучению буддийского канона.
    http://forum.buddism.ru/viewtopic.ph...0bd49437a54356

    На базе программы подстрочного перевода проведен словарный разбор и грамматический анализ 3 томов Кангьюра и половины тома Тенгьюра.
    В Тенгьюре с помощью Дмитрия Ивахненко начали перевод Самскрита-Асамскрита винишчаи
    Это сутра является энциклопедическим изложением основных положений Абидхармы устанавливает связь между положениями Мадхьямики и воззрениями Тхеравады. Часть текста этой стры является переводом Вимуктимаги с языка Пали. Этот перевод на тибетский позволил сохранить этот текст, так как сам оригинал на Пали утрачен.
    Подробнее это описано в теме на форуме "Постижение": http://dhamma.ru/forum/index.php?topic=312.0
    Последний раз редактировалось Центр Риме; 28.05.2016 в 11:12.

  21. Спасибо от:

    Chhyu Dorje (28.05.2016), Ассаджи (28.05.2016), Владимир Николаевич (28.05.2016)

Информация о теме

Участники, просматривающие эту тему

Эту тему просматривают: 1 (участников: 0 , гостей: 1)

Метки этой темы

Ваши права

  • Вы не можете создавать новые темы
  • Вы не можете отвечать в темах
  • Вы не можете прикреплять вложения
  • Вы не можете редактировать свои сообщения
  •