跳转至内容
0
  • 版块
  • 讨论
  • 最新
  • 标签
  • 热门
  • 顶端
  • 用户
  • 版块
  • 讨论
  • 最新
  • 标签
  • 热门
  • 顶端
  • 用户
皮肤
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(Zephyr)
  • 不使用皮肤
折叠
JIKE社区
F

风清扬

@freshwind
关于
帖子
8
主题
3
分享
0
群组
1
粉丝
1
关注
0

帖子

最新 最佳 有争议的

  • Porkbun免费领一年 .xyz .design .wiki .ink 顶级域名
    F 风清扬

    昨天刚注册成功了一个xyz!

    真的是免费一年,还可以顺便开通带广告的wordpress虚拟主机。白嫖一年域名加主机。


    好像是porkbun新客专享。每人限领一个。老用户也可试试看。

    需要验证信用卡,我用的visa卡。划走1美元,即刻退款。貌似银联卡也可以验证,不能100%确定。

    信用卡信息是用来验证身份的,注册域名不扣费。

    不放心的话,注册完成后可以解绑信用卡。


    注册商

    https://porkbun.com/

    优惠码如下:

    .dev CODENEWBIE
    .design UPLABS21B
    .xyz XYZFREE22
    .app CODENEWBIE
    .ink FREEINKWIKI
    .wiki FREEINKWIKI
    .gay GAYPRIDE22


    下面是英文原文,你可以直接点链接去注册(链接自动激活优惠码)。

    $0.00 .XYZ, code: XYZFREE22
    https://porkbun.com/tld/xyz/?coupon=XYZFREE22

    $0.00 .DESIGN, code: UPLABS21B
    https://porkbun.com/tld/design/?coupon=UPLABS21B

    $0.00 .WIKI or .INK, code: FREEINKWIKI
    https://porkbun.com/tld/wiki/?coupon=FREEINKWIKI
    https://porkbun.com/tld/ink/?coupon=FREEINKWIKI

    Limit 1 per new customer
    I don't know if you can only get one domain or one of each type. It may also not work if you have previously received a free domain.


    关于porkbun

    美国亚裔老板(不确定是中国人还是日本人)开的一家比较年轻的域名注册公司。口碑还不错。

    活动优惠

  • 白嫖5台 2H4G1M 一年
    F 风清扬

    @ccc0008 100%被封 挖过

    活动优惠

  • [原创]开源VOSK引擎免费语音转文字 0编程基础也可以操作
    F 风清扬

    关键字:语音识别、语音转文字、录音转文字。

    会议、课程录音需要转文字怎么办呢?最简单的办法当然都是上“讯飞听见”。上传、付费、下载结果。是的,需要付费。如果你有大量的音频内容需要进行文字识别(同时对精度要求不高)还有别的办法吗?你可以使用开源的语音识别引擎来处理这些录音。

    下面我就来介绍一下如何使用VOSK API来处理你的录音。

    VOSK是一个离线开源语音识别工具。它可以识别16种语言,包括中文。你可以把它看做知名语音识别引擎Kaldi ASR的一个Fork(分支)。

    步骤1:安装Python3环境

    前往 https://www.python.org/downloads/ 下载Windows环境版本(Python 3.8以上)。安装过程中选中“Add Python directory to 'PATH' environment variable”。选中之后,Python可以像系统自带命令一样,在所有CMD目录下运行。否则每次执行Python都需要输入它的目录位置。其他选项按默认即可。

    (可选操作)步骤1a:替换下载镜像为清华大学镜像源

    在命令行输入 pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

    这样对于国内用户来说下载速度会更快

    步骤2:安装VOSK API库

    打开CMD(命令提示符)输入 pip install vosk

    步骤3:配置目录并下载语音模型

    在桌面创建 vosk 目录。

    前往 https://alphacephei.com/vosk/models 下载中文语音模型。

    或者直接点击下面的链接下载,并解压到vosk目录下。将解压出来的目录重命名为 “model”(不含引号)。

    vosk-model-cn-0.1.zip
    195M TBD Big narrowband Chinese model for server processing Apache 2.0

    步骤4:下载ffmpeg

    前往 https://github.com/BtbN/FFmpeg-Builds/releases 下载ffmpeg,并将 ffmpeg.exe 解压到桌面 vosk 目录内

    步骤5:安装并打开Notepad++ (或者使用你自己的高级文本编辑器)

    前往 https://notepad-plus-plus.org/downloads/ 下载 notepad++

    (国内镜像:http://www.pc6.com/softview/SoftView_13941.html)

    安装打开,并创建新文件,拷贝以下内容:

    # 使用方法
    # 拷贝语音模型到当前目录下 并命名为 'model'
    # 拷贝ffmpeg.exe文件到当前目录下
    # 执行 python test_ffmpeg.py speech.mp3 即可
    
    #!/usr/bin/env python3
    
    from vosk import Model, KaldiRecognizer, SetLogLevel
    import sys
    import os
    import wave
    import subprocess
    import json
    
    SetLogLevel(0)
    
    if not os.path.exists("model"):
        print ("Please download the model from https://alphacephei.com/vosk/models and unpack as 'model' in the current folder.")
        exit (1)
    
    sample_rate=16000
    model = Model("model")
    rec = KaldiRecognizer(model, sample_rate)
    
    process = subprocess.Popen(['ffmpeg', '-loglevel', 'quiet', '-i',
                                sys.argv[1],
                                '-ar', str(sample_rate) , '-ac', '1', '-f', 's16le', '-'],
                                stdout=subprocess.PIPE)
    
    f = open("result.txt", "w+")
    
    while True:
        data = process.stdout.read(10000)
        if len(data) == 0:
            break
        if rec.AcceptWaveform(data):
            re = rec.Result()
            print(re)
            re = json.loads(re)
            f.write(re['text'] + '\n')
        else:
            print(rec.PartialResult())
    
    f.close()
    
    # print(rec.FinalResult())
    

    另存为 vosk 目录下的 voice2text.py 文件。

    (可选步骤)步骤4a:调试命令行

    步骤4给出的代码最适合处理mp3录音文件。如果你想要处理更多形式的音频,例如实时录音,或者更多的对话模式,例如电影对白,你可以参考官方的代码,地址是 https://github.com/alphacep/vosk-api/tree/master/python/example 。

    步骤4的代码就是根据官方的 test_ffmpeg.py 代码修改而来。

    步骤6:运行程序并识别文字

    将需要识别的mp3/wav/mp4等音视频文件拷贝至 桌面的vosk目录内。例如,我需要识别的文件为 story.mp3。

    进入CMD环境,输入 cd ~/Desktop/vosk 进入工作目录,然后输入 python voice2text.py story.mp3。

    系统开始识别语音内容,你可以看到识别的文字在窗口内一段段显示出来。

    识别效果

    最终结果将存储到 vosk 目录下的 result.txt 文件内。你可以在word中进一步处理这些内容。

    技术专区

  • 【免费游戏】EPIC每天一款游戏大作
    F 风清扬

    这种事还有造谣的 真神奇

    活动优惠

  • 诈骗提醒
    F 风清扬

    骗子对这些新产品掌握的好透彻,阿里应该招安去做产品经理

    水区乐园

  • 文叔叔邀请码
    F 风清扬

    填写我的邀请码:2QWM9G,免费领取 5GB 云存储空间(百年)。不限速,非常好用!https://wenshushu.cn/i/2QWM9G

    活动优惠

  • 有啥好玩的源码撒
    F 风清扬

    送给我挖矿吧

    水区乐园

  • 哪里能买便宜.io域名?
    F 风清扬

    一夜之间好像到处都是.io横行,查了一下价格还比较贵。不知道各位站长大佬为什么偏爱.io呢?是哪里有便宜的卖吗?

    技术专区
  • 1 / 1
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
百度网盘
1,299 个主题
连续剧
728 个主题
国产剧
580 个主题
美剧
351 个主题
中国移动
307 个主题
动画片
246 个主题
中国电信
222 个主题
动作片
211 个主题

166

在线

40.4k

用户

40.1k

主题

110.5k

帖子
  • 第一个帖子
    最后一个帖子