Русские субтитры: Редактирование в Subtitle Workshop - Русские субтитры

Перейти к содержимому

  • (3 Страниц)
  • +
  • 1
  • 2
  • 3
  • Вы не можете создать новую тему
  • Вы не можете ответить в тему

Редактирование в Subtitle Workshop Орфография

#1 Пользователь офлайн   ateist Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 27
  • Регистрация: 12 Апрель 07
  • Страна:

Отправлено 03 Октябрь 2013 - 16:47

На вкладке Орфография кнопки: добавить, заменить все, автозамена. Как правильно ими пользоваться.
Одну и ту же ошибку если во всём файле их многажды, приходится исправлять много раз, нажимая кнопку заменить.Если можно одну и ту же ошибку заменить правильным словом одним кликом,то как? У меня все субтитры транслитизированы с латиницы, на кириллицу.И ошибки одинаковые в разных файлах.
Нельзя ли как-то автоматизировать этот процесс составлением библиотеки неправильных слов с заменой на правильные.
Где можно ознакомиться подробно с процессом редактирования в Subtitle Workshop? С вордом не знаком, хотя чего-то пытался там делать.
0

#2 Пользователь офлайн   Drunkenmunky Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 141
  • Регистрация: 24 Май 11
  • Пол:Мужчина
  • Город:Николаев
  • Страна:

Отправлено 03 Октябрь 2013 - 23:34

Просмотр сообщенияateist (03 Октябрь 2013 - 16:47) писал:

И ошибки одинаковые в разных файлах.
Нельзя ли как-то автоматизировать этот процесс составлением библиотеки неправильных слов с заменой на правильные.

Там есть кнопка "Добавить"

Цитата

С вордом не знакомС вордом не знаком, хотя чего-то пытался там делать.

Он должен быть установлен
0

#3 Пользователь офлайн   ateist Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 27
  • Регистрация: 12 Апрель 07
  • Страна:

Отправлено 04 Октябрь 2013 - 01:07

Просмотр сообщенияDrunkenmunky (03 Октябрь 2013 - 19:34) писал:

Там есть кнопка "Добавить"
Он должен быть установлен



Ворд установлен. При нажатии на ДОБАВИТЬ не происходит замена и приходится возвращаться к прдыдущему слову и редактировать его по новой. Таких слов нужно заменить 90 процентов в файле. Вот как в Субрипе при вытаскиваии
субтитров из ДВД, там дело идёт весьма споро, матрица то пополняется. И последующее распознавание субтитров идёт почти на автомате. Ну это вряд ли, так сказать из области фантазий.Так что давить на ДОБАВИТЬ, время редактирования
увеличивается почти в два раза. Уж проще набить текст на слух по новой. Может быть есть скрытые возможности редактированяя в этой программе о которых я не подозреваю. Поэтому и попросил помощи.
0

#4 Пользователь офлайн   Drunkenmunky Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 141
  • Регистрация: 24 Май 11
  • Пол:Мужчина
  • Город:Николаев
  • Страна:

Отправлено 04 Октябрь 2013 - 01:19

Цитата

У меня все субтитры транслитизированы с латиницы, на кириллицу...

..Таких слов нужно заменить 90 процентов в файле...


Пример исходного текста. Используемые правила транслита.
0

#5 Пользователь офлайн   ateist Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 27
  • Регистрация: 12 Апрель 07
  • Страна:

Отправлено 04 Октябрь 2013 - 11:08

Просмотр сообщенияDrunkenmunky (03 Октябрь 2013 - 21:19) писал:

Пример исходного текста. Используемые правила транслита.



Латиница какая-то неправильная. Например А, она же А,
она же Ш. Ну и дальше в таком же духе.Кое-какие буквы
в латинице меняю на кириллические буквы сразу, их не более,пяти
потом начинается свистопляска с редактированием. :download:/>


00:00:16,720 --> 00:00:20,200
-ekola - sekretn&j woenn&j obyekt.
Obuenie s rodn&mi i blizkimi


00:00:20,280 --> 00:00:21,280
zapreueno.


00:00:21,400 --> 00:00:25,560
-M& hotim datx tebe aans. Prineseax
polxzu Rodine - poluciax prouenie


00:00:25,640 --> 00:00:26,560
ot gosudarstwa.


00:00:26,680 --> 00:00:30,520
-Leboe nepodcinenie nacalxstwu
budet rasceneno kak izmena Rodine.


00:00:30,640 --> 00:00:33,600
-Ona budet ucitxsq wmeste s wami.
-Da kak ve oto tak...


00:00:33,720 --> 00:00:35,840
-Sejcas ona tove nuvna strane.


00:00:42,720 --> 00:00:46,680
-Dewconki skazali, apionila za mnoj.
-epionqt za razwedcikami, a t& twarx


00:00:46,840 --> 00:00:48,280
melkaq.
-Ne nar&wajsq.
0

#6 Пользователь офлайн   Drunkenmunky Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 141
  • Регистрация: 24 Май 11
  • Пол:Мужчина
  • Город:Николаев
  • Страна:

Отправлено 04 Октябрь 2013 - 18:56

Просмотр сообщенияateist (04 Октябрь 2013 - 11:08) писал:

Латиница какая-то неправильная.

Предполагаю, что это набор символов ср1252. Такой транслит используется в отечественном "Телетексте" если телевизор не поддерживает кириллические символы телетекста. Еще лет 10 назад таких телевизоров было большинство.

Цитата

Например А, она же А, она же Ш

Не совсем. "Шш" в таком телетексте отображается как "Àà", "Юю" как "Èè" и т.д.. А "Аа" у вас получается т.к., вероятно, вы неправильно выставляете кодировку. В cp1251 "Àà" и т.п. нет

Цитата

Ну и дальше в таком же духе.

Именно.

Цитата

Кое-какие буквы в латинице меняю на кириллические буквы сразу, их не более,пяти
потом начинается свистопляска с редактированием.

Вам нужна программа "транслитератор" с возможностью редактирования "пользовательских таблиц"(правил транслита). Или же обратитесь в раздел этого форума посвященный скриптам SW.
0

#7 Пользователь офлайн   ateist Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 27
  • Регистрация: 12 Апрель 07
  • Страна:

Отправлено 04 Октябрь 2013 - 19:43

Cпасибо. Я с вами согласен. Нужна "правильная" кодировка. Вернее транслитератор с нужной кодировкой.Конкретно можете указать какая именно? И где можно её скачать? Ну и сам постараюсь нарыть.
0

#8 Пользователь офлайн   Drunkenmunky Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 141
  • Регистрация: 24 Май 11
  • Пол:Мужчина
  • Город:Николаев
  • Страна:

Отправлено 04 Октябрь 2013 - 21:05

Просмотр сообщенияateist (04 Октябрь 2013 - 19:43) писал:

И где можно её скачать?


Попробуйте прилагаемый.

Файл "Translit.html" откройте в своем браузере. Предварительно отредактировав под свои нужды файл "translit_tt.js" в стандартном Блокноте.

Прикрепленный файл  translit.zip (1,75К)
Количество загрузок:: 2



0

#9 Пользователь офлайн   ateist Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 27
  • Регистрация: 12 Апрель 07
  • Страна:

Отправлено 05 Октябрь 2013 - 11:13

Просмотр сообщенияDrunkenmunky (04 Октябрь 2013 - 17:05) писал:

Попробуйте прилагаемый.

Файл "Translit.html" откройте в своем браузере. Предварительно отредактировав под свои нужды файл "translit_tt.js" в стандартном Блокноте.

Прикрепленный файл translit.zip


Проблема в том что субтитры уже вытянуты в таком виде при помощи тсдоктор, а в ней ясен пень отсутствует декриптор кириллицы. И уже смена страниц кодировки ничего не даст. Это должно решаться установлением на прграмном уровне автором этой проги.Может быть нужно искать другую прогу, чтобы извлекать из транспортного потока
корректно субтитры в кириллице.Но сии проги мне неизвестны, есть кое-какие, но нет решения проблемы. Как-то так сумбурно всё это изложено мной,но суть , я думаю, вы уловили.Что вы можете подсказать по этому поводу?
0

#10 Пользователь офлайн   Drunkenmunky Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 141
  • Регистрация: 24 Май 11
  • Пол:Мужчина
  • Город:Николаев
  • Страна:

Отправлено 05 Октябрь 2013 - 12:19

Просмотр сообщенияateist (05 Октябрь 2013 - 11:13) писал:

уже вытянуты в таком виде при помощи тсдоктор,


Что-то мне сомнительно. Ещё раз обращаю ваше внимание, что такие символы как Ш, Ч, Ю и прочие передаются (по крайней мере как я помню) в виде символов с диакритикой. И скорее всего эти дополнительные элементы теряются именно при извлечении\распознавании(как мне кажется). Если б вы выложили пару скриншотов "процесса" обращения с "тсдоктором"(не имел удовольствия), было бы больше ясности.


0

#11 Пользователь офлайн   НуПогоди Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Избранные
  • Сообщений: 832
  • Регистрация: 31 Июль 06
  • Страна:
  • Прислал(a) субтитров: 46
  • Своих переводов: 19

Отправлено 05 Октябрь 2013 - 12:32

Просмотр сообщенияateist (05 Октябрь 2013 - 09:13) писал:

Что вы можете подсказать по этому поводу?

Ни одна из известных мне видов транслитерации тут не подойдет, т.е. готовой программы, которая приведет эти крякозябры в осмысленный текст, вам скорее всего не найти. Лучше сами сделайте таблицу нужной вам перекодировки, т.е. обычный текстовый файл, в котором каждая строка имеет вид
a -> а
b -> б
...
& -> ы
и т.д.
Если одни и те же латинские буквы используются не только сами, но и в сочетании (sh - ш), включите в файл и их (лучше в верхней части списка). Остальное решается автозаменой, в один клик -- либо каким-нибудь макросом в продвинутом текстовом редакторе, либо, как уже советовали, прямо в Воркшопе через паскаль-скрипты.




0

#12 Пользователь офлайн   ateist Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 27
  • Регистрация: 12 Апрель 07
  • Страна:

Отправлено 05 Октябрь 2013 - 13:33

Просмотр сообщенияDrunkenmunky (05 Октябрь 2013 - 08:19) писал:

Что-то мне сомнительно. Ещё раз обращаю ваше внимание, что такие символы как Ш, Ч, Ю и прочие передаются (по крайней мере как я помню) в виде символов с диакритикой. И скорее всего эти дополнительные элементы теряются именно при извлечении\распознавании(как мне кажется). Если б вы выложили пару скриншотов "процесса" обращения с "тсдоктором"(не имел удовольствия), было бы больше ясности.



Я с вами полностью согласен.Проблема и и ещё в том, что обладаю весьма скудными познаниями в данной области.
Вы уж извините меня, с криншотами не умею обращаться.Скажу на словах.Всё идёт как бы на автомате, конечно кое-какие предварительные настройки всё же делаю по мелочи,в выводе субтитров настроек,считай что нет.Транспортный поток разбивается на составляющие: видео,звук,субтитры, до этого т.поток проверяется на наличие ошибок,исправляется.Затем получаю на выходе видео и субтитры в srt. Если этот файл пропустить через ресивер, на котором данный файл писался, то он покажет смотрибельные субтитры, но не те которые были извлечены из потока,
а те которые находятся на странице телетекста №888.
0

#13 Пользователь офлайн   ateist Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 27
  • Регистрация: 12 Апрель 07
  • Страна:

Отправлено 05 Октябрь 2013 - 14:17

Просмотр сообщенияDrunkenmunky (05 Октябрь 2013 - 08:19) писал:

Что-то мне сомнительно. Ещё раз обращаю ваше внимание, что такие символы как Ш, Ч, Ю и прочие передаются (по крайней мере как я помню) в виде символов с диакритикой. И скорее всего эти дополнительные элементы теряются именно при извлечении\распознавании(как мне кажется). Если б вы выложили пару скриншотов "процесса" обращения с "тсдоктором"(не имел удовольствия), было бы больше ясности.


Да, конечно.Мне известны 5 букв + заглавные, которые можно безболезненно заменить при редактировании в Воркшопе.Сочетаний sh нет. Есть другие сочетания, которые,да, можно применить к некоторым словам, а в некоторых искажает смысл слова, что-то лечишь,а что-то калечишь. Если бы была обычная латиница, то и проблем не было-бы. Было бы у меня столько же познаний в этом как у вас, то наверно бы нашёл решение данной проблемы. :search:
0

#14 Пользователь офлайн   Drunkenmunky Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 141
  • Регистрация: 24 Май 11
  • Пол:Мужчина
  • Город:Николаев
  • Страна:

Отправлено 05 Октябрь 2013 - 15:08

Просмотр сообщенияateist (05 Октябрь 2013 - 14:17) писал:

Есть другие сочетания, которые,да, можно применить к некоторым словам, а в некоторых искажает смысл слова, что-то лечишь,а что-то калечишь.


Ну, тут есть только один выход - сначала заменять известные проблемные слова или их части(вряд ли их очень много - 200-300).
Если хотите, я отредактирую предыдущий скрипт. Соберите эти самые проблемные слова через запятую или в виде списка. Впоследствии сможете добавлять их в скрипт самостоятельно.
Кроме того аналогичный скрипт есть и в SW(инструменты>информация и ошибки>Скрипты OCR), но его так же требуется заполнять вручную, и он несколько сложнее.
0

#15 Пользователь офлайн   ateist Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 27
  • Регистрация: 12 Апрель 07
  • Страна:

Отправлено 05 Октябрь 2013 - 18:19

Просмотр сообщенияDrunkenmunky (05 Октябрь 2013 - 11:08) писал:

Ну, тут есть только один выход - сначала заменять известные проблемные слова или их части(вряд ли их очень много - 200-300).
Если хотите, я отредактирую предыдущий скрипт. Соберите эти самые проблемные слова через запятую или в виде списка. Впоследствии сможете добавлять их в скрипт самостоятельно.
Кроме того аналогичный скрипт есть и в SW(инструменты>информация и ошибки>Скрипты OCR), но его так же требуется заполнять вручную, и он несколько сложнее.


Спасибо вам.Я ещё раз проверю сочетание парных букв на наличие ошибок и скину вам. Вот если бы ещё сделать обширную библиотеку заменяемых слов на правильные, чтобы при загрузке это шло автоматом, этак слов 200-300, было бы просто здорово.Процентов на 95 проблема была бы практически решена. на днях соберу компьютер для опытов и поробую сменить региональнй язык и кодировку, установлю TSDoctor и попробую вытащить субтитры.
0

#16 Пользователь офлайн   ateist Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 27
  • Регистрация: 12 Апрель 07
  • Страна:

Отправлено 05 Октябрь 2013 - 18:27

Просмотр сообщенияDrunkenmunky (05 Октябрь 2013 - 08:19) писал:

Что-то мне сомнительно. Ещё раз обращаю ваше внимание, что такие символы как Ш, Ч, Ю и прочие передаются (по крайней мере как я помню) в виде символов с диакритикой. И скорее всего эти дополнительные элементы теряются именно при извлечении\распознавании(как мне кажется). Если б вы выложили пару скриншотов "процесса" обращения с "тсдоктором"(не имел удовольствия), было бы больше ясности.



Вы очень верно подметили, что диакритические символы теряются при извлечении субтитров. Если бы они сохранялись,
то можно было привести символы в удобоваримый вид сменой кодировки 1252 на 1251 и всё бы стало на свои места.
0

#17 Пользователь офлайн   Drunkenmunky Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 141
  • Регистрация: 24 Май 11
  • Пол:Мужчина
  • Город:Николаев
  • Страна:

Отправлено 05 Октябрь 2013 - 18:56

Просмотр сообщенияateist (05 Октябрь 2013 - 18:19) писал:

Я ещё раз проверю сочетание парных букв на наличие ошибок и скину вам. Вот если бы ещё сделать обширную библиотеку заменяемых слов на правильные, чтобы при загрузке это шло автоматом, этак слов 200-300


Хорошо
0

#18 Пользователь офлайн   ateist Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 27
  • Регистрация: 12 Апрель 07
  • Страна:

Отправлено 06 Октябрь 2013 - 16:03

Просмотр сообщенияDrunkenmunky (05 Октябрь 2013 - 14:56) писал:

Хорошо



Кто объяснит назначение кнопок на вкладке ОРФОГРАФИЯ в программе Воркшоп: заменить всё, автозамена?
0

#19 Пользователь офлайн   Drunkenmunky Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 141
  • Регистрация: 24 Май 11
  • Пол:Мужчина
  • Город:Николаев
  • Страна:

Отправлено 06 Октябрь 2013 - 16:58

Просмотр сообщенияateist (06 Октябрь 2013 - 16:03) писал:

Кто объяснит назначение кнопок на вкладке ОРФОГРАФИЯ в программе Воркшоп: заменить всё, автозамена?

"Заменить" - заменить предложенным словом выделенное слово.
"Заменить всё" - заменить предложенным словом выделенное слово во всём тексте.
"Автозамена" - заменить предложенным словом выделенное слово во всём тексте и всех последующих, запомнить выбор и больше не спрашивать.
0

#20 Пользователь офлайн   ateist Иконка

  • Иконка
  • Отправить ЛС
  • Группа: Members
  • Сообщений: 27
  • Регистрация: 12 Апрель 07
  • Страна:

Отправлено 06 Октябрь 2013 - 17:28

Просмотр сообщенияDrunkenmunky (06 Октябрь 2013 - 12:58) писал:

"Заменить" - заменить предложенным словом выделенное слово.
"Заменить всё" - заменить предложенным словом выделенное слово во всём тексте.
"Автозамена" - заменить предложенным словом выделенное слово во всём тексте и всех последующих, запомнить выбор и больше не спрашивать.



Я конечно немного утрировал, задавая вопрос о назначении этих кнопок.
Спросил я не зря.ЗАМЕНИТЬ-заменяет. ЗАМЕНИТЬ ВСЁ и АВТОЗАМЕНА-только заменяет.Если бы эти кнопки выполняли свои функции, то жить было бы проще. В чём может быть проблема? Не работают они у меня лет десять.Например, слово: ито нужно заменить на слово:что.Хоть нажимай на все кнопки по очереди-результат один, только заменяет одно слово, а ведь нужно заменить одно и то же слово 50-200 раз. Проще уж в ПОИСКЕ и ЗАМЕНА найти и заменить все скопом.Если бы АВТОЗАМЕНА работала, то у меня бы работа по редпктированию субтитров занимала от силы минут 30. Что- то у меня не так работает. Что посоветуете?
0

  • (3 Страниц)
  • +
  • 1
  • 2
  • 3
  • Вы не можете создать новую тему
  • Вы не можете ответить в тему