在 macOS 已经启用了一个或者若干个词典的情况下:
首先查看 /System/Library/AssetsV2/com_apple_MobileAsset_DictionaryServices_dictionaryOSX/ 这个目录,里面以一连串数字开头、以 .asset 结尾的目录,就是词典文件。一个 .asset 目录对应一个文件。你的词典 app 里面开启了几种词典,这里就有几个目录。比如我有三个词典,因此有三个 .asset 目录。
再看目录下面的 AssetData ,里面写着词典的名字,比如我准备研究 Simplified Chinese – Japanese.dictionary。
继续看词典下面的 Contents/Resources/,有个写着 Body.data 的文件,这就是词典的数据文件。是二进制文件,不能直接打开。
这时需要使用 github 上的 apple-dictionary 这个工具来解析词典 Body.data 文件,命令是:
./dedict ./Body.data | ./strip | ./checkxml.py > dictionary.xml
此时在当前目录下面生成一个 dictionary.xml 文件。然后就可以用自己喜欢的编程语言解析这个 XML 文件了。
详情参考我的一个实际操作:
https://springwood.me/macos-dictionary-cn-jp-all-diff-words/--
FROM 157.82.242.*