AI
Listnr能将任何文本转化为140多种语言的语音,自然到你根本听不出是机器生成的!
1、工具简介 Listnr 是一款创新的人工智能语音合成工具,可将文本转换为语音,并支持视频中的语音合成。该平台提供 1000 多种不同的声音,覆盖 142 种以上的语言,包括模拟用户自己的声音。Listnr 利用最新的生成式人工智能技术,生成的语音极为自然…
最便捷的LLama部署方法开源,GitHub 1万5千星
开源的进展太快! 仅仅一个文件,轻松在个人电脑部署 LLama!
源代码
https://github.com/Mozilla-Ocho/llamafile
llamafile 是一个开源项目,它的主要特点是允许开发人员和终端用户使用单个文件分发和运行大型语言模型(LLM…
Cloudflare出奇迹: 免费使用众多开源 AI 大模型
Cloudflare 一直以来都致力于推动互联网技术的发展,使其更加开放、安全、快速。此次免费开放大模型使用的举措,不仅降低了技术门槛,让更多的人能够接触和利用最前沿的人工智能技术,同时也预示着我们正在步入一个 AI 更加普及和便捷的新时代。 Cloudflare…
GeoSpy AI:AI 识别照片地理位置工具
GeoSpy AI 是一款基于人工智能技术的图片地理位置识别工具,它能够分析用户上传的照片,并推断出拍摄地点的地理位置。这个工具的准确率相当高,而且使用起来非常简单:用户只需上传照片,AI 就会根据照片中的景物特征进行识别。 GeoSpy AI 目前免费向公众开放…
视频翻译,开源免费。Translation-starter带你轻松实现唇同步。
今天,我要向大家介绍一个令人兴奋的开源项目 ——Translation-starter,由 Synchronicity Labs 精心打造。这是一个强大的视频翻译应用起点,它能够在短短 15 分钟内,将您的视频内容翻译成世界上任何一种语言,并且通过 AI 技术实现完美的唇同步效果…
用Coze打造一个全是AI的企业微信
最近字节的 coze 平台新增了将大模型 bot 一键发布到微信的能力。 前期准备
企业微信官网链接我放到这里
https://work.weixin.qq.com/
任何人都可以注册一个企业微信,不需要非得企业认证。
就像注册账号一样,很简单。注册完成之后安装企业微信…
解压即用的AI数字人整合包DreamTalk,可设置表情!
DreamTalk 是一款创新的 AI 数字人表情生成工具,它基于先进的扩散模型技术,能够根据音频输入生成富有表现力的人物表情视频。无论是语音或歌曲,DreamTalk 都能以惊人的逼真度和多样化的表情风格,将静态图片转换成动态的表情视频,呈现出色的视觉效果。 核心功能
Drea…
AI能够写小说了!还能给小说配图!快来感受下(MidReal AI)
今天,我要给大家介绍一个令人兴奋的新平台 ——MidReal AI 这是一个由 MIT、NYU、剑桥、普林斯顿联合打造的 AI 生成小说产品,可以根据提示生成小说并且还能给小说配图!配图是通过 sd 来实现的。
官网地址:
https://midreal.ai/
MidRea…
小众的Reka AI
Reka Core 亮点: 1、多模态能力:具备图像,视频和音频理解能力。它对图像、视频和音频具有强大的上下文理解能力,是目前市面上除了 Gemini 之外唯二的全模态能力模型。 2、128K 上下文窗口 3、极强的推理能力。Core 具有超强的推理能力(包括语言和数学…
免费开源,无需 GPU,本地化部署大语言模型的对话系统
项目名: FreeAskInternet -- 本地化大语言模型的对话系统 Github 开源地址:https://github.com/nashsu/FreeAskInternet
FreeAskInternet 是一个免费开源的大语言模型工具…
欢迎 Llama 3:Meta 的新一代开源大语言模型
Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本,现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋,我们也非常高兴地全力支持此次发布,并实现了与 Hugging Face 生态系统的深度集成。 Llam…
AI视频模型!一句话即可生成120秒视频,免费开源!
近日,Picsart AI 研究团队联合发布的 StreamingT2V 模型可以生成长达 2 分钟(1200 帧)的高质量视频,超越了之前的 Sora 模型。这一开源模型不仅可以生成更长的视频,还可以与 SVD、animatediff 等其他模型无缝兼容…
CodeGemma:基于Gemma的开源代码模型,简单测试了一下,效果不错
CodeGemma,一个基于 Google DeepMind 的 Gemma 模型构建的开源代码模型家族,已经在代码生成和理解领域引起了巨大关注。这个模型不仅提高了代码生成能力,还保留了强大的自然语言理解能力,为各种应用场景提供了强大的支持。在这篇论文中,我们将深入探讨…
STORM:自动化生成像维基百科一样的深度长篇内容
这是一个由斯坦福大学开发的,可以自动化从头开始编写像维基百科一样的有广度和深度,有根据和有组织的长篇文章。 它可以通过互联网搜索,自动搜集资料,并会模拟专家和作者的对话生成结构化的文章大纲,最后生成完整的文章。
此外,它还会对文章进行润色,改进语句、结构…
本地搭建属于你自己的AI搜索引擎,太强了!
今天逛 Github,发现一个最近两天非常热门的开源项目 - FreeAskInternet,star 数在狂涨,仅仅几天时间已经有 5K+star 了。 项目简介
FreeAskInternet 是一个完全免费、私密且在本地运行的搜索聚合器和答案生成器(即问答 AI 工具…
54.8k Star开源项目,GPT-4Free : 让GPT4免费不是梦
有了 GPT4Free,你可以免费使用这些大模型了。这个项目通过一种巧妙的方式工作:它伪装成了 chatgpt 的官方聊天客户端,或者是其他一些已经向 OpenAI 付费的网站,比如 poe、bing 等,然后调用这些网站的接口来间接调用 OpenAI 的服务。 而且…
Udio V1:AI 通过文本提示生成各种风格的音乐模型
Udio V1 是一款由前 Google DeepMind 团队成员开发的 AI 音乐生成工具,能够根据文本提示创作出不同风格的音乐。 每月可以免费生成 1200 首歌曲,这一服务为音乐创作者和爱好者提供了极大的便利和创作空间。
网站地址
https://www.udio.com
给视频、图片去除水印的AI工具
1. 视频去水印: Video-subtitle-remover (VSR) 是一款基于 AI 技术,将视频中的硬字幕去除的软件。 主要实现了以下功能:
无损分辨率将视频中的硬字幕去除,生成去除字幕后的文件
通过超强 AI 算法模型,对去除字幕文本的区域进行填充…