Azure Text to Speech
受凯文的启发来到这里,是时候尝试新的东西。
Azure(爱sure的发音s换成z)neural 的语音还是可以的,感觉毕 siri 还好点。神经网络语音每月免费50万字符/单机,付费的话 16刀/1m。
人工智能和机器学习还不进入更待何时。
受凯文的启发来到这里,是时候尝试新的东西。
Azure(爱sure的发音s换成z)neural 的语音还是可以的,感觉毕 siri 还好点。神经网络语音每月免费50万字符/单机,付费的话 16刀/1m。
人工智能和机器学习还不进入更待何时。
第一次用还有点费劲
经过两个多月的使用发现还是挺方便的,也学到了不少invocation的东西,但是总感觉测试有点事后诸葛亮的味道,尤其是当前对着已有的代码写测试用例,还没有get到它的威力,还是TDD开发,啥时候试试看。
早年没记错的话13或者14左右,自己实现了一个 mac app 的动态注入,主要是日志打印出这个 app 里的一个登录密码,当时那个兴奋啊,可惜就是没有留下任何记录,今天又有了一个其他的需求,那么记录下来吧。
想到的东西都去实践,记录总结,就肯定会成为少数牛派。
目前 swizzle 对我的认知也就是 log 或者 更改所有 button 前置检查是否登录这两种,期待新的发现。
现如今鉴于环境的问题,work from home 的职缺多了起来,软件开发中的 wfh 需要的特别技能就显现出来了。
unit test
单元测试code Coverage
代码覆盖率Continuous Integration
CI 持续集成3年前貌似也装过水果 fl studio,惊叹于强大之后,也没有然后了;
今年借过一本logic pro x的书,没看完,而且排版顺序完全没有实操的顺序,完全打击好奇心😂;
今年还在youtube上看到只用 garageband 来还原各种曲子的神奇网友
今天再次看到 sonic pi 貌似终于可以好好入门了。。。
之前也断断续续看过,因为都是改下判断跳过检查之类的,也没记录下来。
直到需要看一个怎么用数据库的值来计算语音的开始结束位置,愣是半天看不懂,才想好好整理下,但是万万没想到最后的路径也还是中断了。。。
ffmpeg -i input.mp3 -af silencedetect=d=0.5 -f null - |& awk '/silencedetect/ {print $4,$5}'
brew install blackhole-16ch
之前也听过这个软件,直到最近才开始用起来,用了两天发现挺好用,尤其是倒入了网上的jp2000词汇这种,语音图片而且自动帮你计算重复间隔,棒棒哒。
但是就是设置貌似有门槛,各种参数太吓人哈,慢慢适应~
重要性毋庸置疑,但是能主动的发现问题,又坦诚的接纳自己,想着真的做起来,万万不易。
但是世间万事万物很多都已经有了理论,看看相关的书籍或者wiki大都能了解不少,当然一手的资料还大都是英文,掌握关键词有助于搜集信息。