This box will be fixed on your screen using Firefox, Opera9 or IE7.

Cli: 自制双语 Srt 字幕 Part 2

如果很不幸,你下载的中英文字幕的时间轴差别很大,这时按照上一篇的方法制作出来的双语字幕就会出现紊乱。其实这个问题还是可以解决的。以射手网的 srt 字幕为例,每一句字幕由三部分组成:序号、时间轴、字幕文字。由于没有搜到 srt 标准比较官方的资料,只发现对于 srt 字幕来说,时间轴和字幕文字是必须的,也就是说,序号可有可无。那对于时间轴差别很大的两个字幕文件来说,只要按时间顺序将其合并,上面提到的问题就迎刃而解了。

假设手中有 mov.chs.srt 和 mov.eng.srt 两个文件,这两个文件的时间轴经过对比差别很大。

step 1: 先用正则去掉两个文件中每句前的序号,我使用 vim,一句搞掂。总之正则语法很多编器器差异并不很大。

:%s/^\d\{1,3\}\n//g
说明:删除以最多3位数字(一般都没超过1000句)开头的行。应该也可以使用命令行管道命令操作,但我发现即使 grep –extended-regexp 好像也不支持 \d 这样的简写,所以用 vim 也没什么不方便的。

Step 2: 按照上一文章中所讲命令行方法合并差异,生成一个新的文件。然后再用管道命令去除文件中以 # 开头的行就宣告大功告成了。

相对于 Part 1 文章,也仅仅是多一个步骤──去除字幕文件中的序号行。工作量并未增加多少。对于制作双语字幕的两篇文件,算是命令行的一次活学活用吧,当中用到的其实都是极其简单和常用的几个命令,命令行魅力可见一般。

1 Comment

  1. +TGS+站长 Comments @ 14:29:09 on 2007-05-29

    不好意思,以前+TGS+(g-space.cn)的BLOG因故关闭,请留意下贵站上如有小站的LOGO链接的话,请检查有无问题,如果有或者没有都请务必到小站置顶帖回复一下您恢复和我小站的链接情况,因为本小站最近BLOG又开通了,很多以前和我小站交换过链接的朋友都丢失了链接,继续更新文章中,谢谢支持!!!

    如果贵站从来没和小站交换过链接的话,可以交换下链接吗?

    本小站名字:+TGS+
    LOGO:http://g-space.cn/g-space.cn.gif
    链接:http://blog.g-space.cn/