软件介绍
Lab-Cat免费版是一个可以在浏览器上使用的语言学研究工具。我们可以通过Lab-Cat完成各种面试成绩单的存储,让你更好的进行语言学研究。
la B- CAT免费版软件功能
和存储媒体记录簿。LaBB-CAT本质上是一个音频/视频记录的时间对齐抄本的存储库。transcriptor、Praat或ELAN(可用于创建文件以将抄本文本与音频/视频记录中的相应位置对齐)可用于制作时间对齐的抄本。然后,抄本被上传到la B- CAT,这允许存储关于发言者和抄本的附加信息。
转录本,Praat或ELAN。
征求意见的任务
您还可以定义诱导任务,包括提示参与者阅读并提出问题让他们回答。
当参与者完成任务时(使用他们的浏览器或移动设备),他们的声音将被记录下来,并自动直接上传到LaBB-CAT。
自动注释
结合信号数据,原正投影转录和一些第三方数据和工具,转录可以自动标记,例如。
词汇标签
在CELEX数据的帮助下,单词可以用更多的数据自动注释。
语音学
摘要
形态学
色调
频率
也可以集成其他词典,包括CMU发音词典和优利词典。
强制对齐
在HTK或WebMAUS的帮助下,可以将句子级别对齐的抄本强制对齐到单词和段落级别。
使用HTK强制对齐
统计层
la B- CAT数据库本身的词频数据可以直接计算并标注每个词。
词频层
语言学和字数统计”(LIWC)可以用来比较语料库和参考语料库。
LIWC比较
结合CELEX的时间安排信息和音节数,可以计算出不同领域的语速。
每分钟的音节数,行和转的音节数。
斯坦福解析器
借助Stanford Parser,可以为抄本生成可编辑的语法树。
跨语法组件的注释。
解析树表示
脚本
可以用Python或Javascript编写脚本来执行任意计算和注释任务。
用于计算双重可变性指数的Python脚本
IBM Watson的人格洞察力
LaBB-CAT可以与IBM Watson的Personality Insights网络服务集成,以分析成绩单的个性。
手动注释
例如,可以手动添加注释。
主题标签
单个单词的文本标签
时间点或时间间隔可以用Praat注释。
使用Praat标注点。
恢复
笔记本和笔记准备就绪后,您可以搜索符合特定标准的笔记本(例如,根据演讲者的年龄/性别、笔记本所属的语料库等)。).
按属性过滤发言者
当发言者被选中时,他们可以在不同的层中搜索他们的句子,以找到文本或正则表达式。
在“成人”主题中搜索“the”,然后在音位层面搜索以I,E,I或@开头的词。
这将返回所选抄本中与查询匹配的所有语句的列表。
搜索结果
如有必要,可以将此列表连同相关的演讲者和注释信息直接导出为csv文件,以便在Excel或r中进一步分析。
搜索结果
或者可以提取音频样本用于分析。
从结果中提取音频
或者您可以使用EMU-webApp直接编辑语句注释和对齐。
使用EMU-webApp编辑手机校准。
如果该语句已被强制对齐,则可以用Praat批处理目标段。
使用Praat进行批处理,以提取形状和其他声学度量。
批处理Praat可以包含您自己的自定义Praat脚本。
用于搜索结果批处理的自定义Praat脚本。
此外,点击搜索返回的句子会产生一个完整的发言人的文字记录,它将与相关的句子一起放在屏幕的顶部。你可以点击抄本的任何部分,播放媒体的相应部分。
交互式脚本
直接从交互式转录页面播放媒体,显示其他注释层,提取这一行的音频,或者在Praat中打开相应的包含注释的TextGrid。您可以添加、编辑或删除注释,并调整对齐方式。