AI - 第2页 - 网站分类

Codex 正在推动开源 AI 模型的训练与发布

继我们使用 Claude Code 训练开源模型的项目之后，现在我们更进一步，将 Codex 引入这一流程。这里的重点不是“Codex 自己开源模型”，而是让 Codex 作为编码代理，参与并自动化开源模型的训练、评估与发布全流程。为此，我们为 Codex 接入了 Hugging Face Skil ...

经同意的语音克隆

在这篇博客文章中，我们介绍了“语音同意验证机制 (voice consent gate)”的概念，支持通过明确同意来进行语音克隆。我们还提供了一个示例 Space 应用和相关代码，帮助大家快速上手这一想法。近年来，逼真的语音生成技术已经达到了令人惊讶的水平。在某些情况下，生成出来的合成语音几 ...

流式数据集：效率提升 100 倍！

快速了解（TLDR）现在只需一行代码，就能通过 load_dataset('dataset', streaming=True) 以流式方式加载数据集，无需下载！无需复杂配置、不占磁盘空间、不再担心 “磁盘已满” 或 429 请求过多错误，立即开始训练 TB 级数据集！性能非常强劲：在 64×H ...

读人机沟通法则：理解数字世界的设计与形成03机器是有生命的

1. 有没有生命 1.1. 看到一个物体在运动是判断其有生命的第一条线索 1.2. 智能手机和自动驾驶汽车出现之前就存在的技术：自动客服代表 1.3. 过去，人们很容易认为计算机很笨，因为它做任何事情都要花很长时间 1.3.1. 过去的交互技术很简单，缺少许多必要的组成部分，只能缓慢地响应我们的输入 ...

基于深度学习的草莓健康度检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

本文介绍了一套基于YOLO算法的草莓健康度智能检测系统。该系统采用三栏式界面设计，支持图片、视频和实时摄像头检测，能自动识别10种草莓病害状态并生成可视化报告。系统内置YOLOv5/v8/v11/v12多模型切换功能，其中YOLO12n以40.6%mAP表现最优，YOLO11n则以56.1ms推理速... ...

7款超好用的AI换脸软件，一键视频直播换脸（附下载链接）

随着AIGC的火爆，AI换脸技术也被广泛应用于娱乐、广告、电影制作等领域，本期文章系统介绍了市面上超火的7款AI软件换脸整合包收录了全部7款AI工具，请按照需要选择下载：百度网盘：https://pan.baidu.com/s/1adTExVtBgVB9-ZRe4KO7bw?pwd=br9e 1 ...

读人机沟通法则：理解数字世界的设计与形成01机器循环运行

1. 计算 1.1. 计算是一个无形的陌生宇宙，它无限广阔，同时包含无限多的细节 1.2. 它是一种不遵循物理定律的原材料，在某种意义上为互联网提供了远超于电的力量 1.3. 它是一种无处不在的媒介，由经验丰富的软件开发人员和科技行业控制，他们对计算的掌控程度甚至可能威胁国家主权 1.4. 今天我们 ...

基于深度学习的螺栓螺母检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

摘要：本文介绍了一个基于YOLO算法的螺栓螺母智能检测系统，可精准识别图片和视频中的零件细节。系统采用三栏式界面设计，支持多模态检测、模型切换和个人信息管理。核心代码展示了YOLO模型的批量训练流程，可自动处理数据集路径并支持多种预训练模型。技术对比显示YOLO12n模型在精度和效率上表现最优。该系... ...

阿里Z-Image图像生成模型容器部署

背景 Z-Image是阿里巴巴通义实验室开发的一款开源图像生成模型，详细介结可以看这儿《Z-Image图像生成模型发布与竞品》。Z-Image系列高性能生成模型，其中包括用于快速推理的Z-Image-Turbo和专业的图像编辑模型Z-Image-Edit。这些模型基于可扩展单流扩散转换器 (S3- ...

最新AI换脸软件，全面升级可直播，Mirage下载介绍（支持cpu）

Mirage是一款功能强大且操作简单的AI换脸工具，它采用先进的人工智能技术，基于PyTorch+TensorRT框架构建，凭借双加速特点实现换脸速度提升数倍，打破了传统换脸工具在速度与效果上的瓶颈，为用户提供图片、视频、网络直播等多场景的逼真换脸体验针对图片和视频换脸场景，用户只需导入待换脸的图 ...

基于深度学习的非机动车头盔检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

本文介绍了一个基于YOLO算法的非机动车头盔检测系统，通过深度学习技术实现骑行安全监测。系统采用PyQt5前端界面和SQLite数据库，支持图片、视频及实时摄像头的多模态检测，具备模型切换、参数调节和结果统计功能。核心代码展示了YOLO模型批量训练工具，支持自动路径修正和多模型训练对比。实验数据显示... ...

OceanBase 向量索引优化指南

这篇文章会从向量索引的构建过程开始讲起，为大家深入且详细地分析：索引创建耗时慢优化问题、创建时对内存的要求、增量达到什么规模需要重建、重建性能影响等和数据库中向量索引有关的问题，欢迎感兴趣的同学阅读~ ...

吴恩达深度学习课程四：计算机视觉第二周：经典网络结构课后习题和代码实践

此分类用于记录吴恩达深度学习课程的学习笔记。课程相关信息链接如下：原课程视频链接：[双语字幕]吴恩达深度学习deeplearning.ai github课程资料，含课件与笔记:吴恩达深度学习教学资料课程配套练习（中英）与答案：吴恩达深度学习课后习题与答案本篇为第四课第二周的课后习题和代码实践 ...

读智能新物种08读后总结与感想兼导读

1. 基本信息智能新物种 [美]凯特·达林，浙江科学技术出版社，2024年11月 1.1. 读薄率书籍总字数18.2万字，笔记总字数22184字。读薄率22184÷182000≈12.19% 1.2. 读厚方向当我点击时，算法在想什么？算法霸权极简算法史：从数学到机器的故事算法的陷阱 ...

告别繁琐操作！这款神器用 AI 轻松绘制专业图表！

next-ai-draw-io —— 一个集成了 AI 功能的 Next.js 网页应用，与 Draw.io 图表无缝结合，通过自然语言命令和 AI 辅助可视化来创建、修改和增强图表。 ...

从日志解析到通用工程LLM

导言在当今的工程领域，我们普遍面临一个核心挑战：如何从海量的、非结构化的数据（如日志、配置文件、告警信息）中高效提取价值。这些数据是诊断系统故障、洞察系统行为的“救命稻草”，但其杂乱无章的格式对机器而言形同“天书”。大语言模型（LLM）的出现，以其前所未有的语义理解能力，为破解这一难题带来了希望。 ...

AI幻觉闲聊杂谈

AI幻觉(AI Hallucination)是指AI模型生成看似合理但完全不符合事实的内容. 表现为"一本正经地胡说八道". 个人使用一些AI工具到目前为止,发现AI幻觉越来越多了,可能也跟使用的频率有关系, 结合最近亲身经历的两个例子,来聊一聊AI幻觉上周周末,诸多杂事,没有及时给6年级小孩检查 ...

基于深度学习的水果品质检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

本文介绍了一种基于YOLO系列深度学习算法的水果品质检测系统。该系统可自动识别多种水果（如草莓、香蕉等）及其变质程度（优质、轻微变质、腐烂），使用超过21,000张图片的数据集训练，在YOLOv5、v8、v11和v12等多个模型版本中实现高精度检测。系统采用三栏式用户界面，支持图片、视频、摄像头等多... ...

Spring AI Alibaba 入门指南

1. 概述 Spring AI Alibaba 开源项目基于 Spring AI 构建，是阿里云通义系列模型及服务在 Java AI 应用开发领域的最佳实践，提供高层次的 AI API 抽象与云原生基础设施集成方案和企业级 AI 应用生态集成。在用Spring AI搭建Java AI应用的时候，会 ...

大语言模型~Ollama本地模型和java一起体验LLM

语言模型语言模型（language model,LM）通过计算单词序列的概率进行语言建模，其主要作用是基于给定的上下文，预测序列中下一个词的概率分布。随着计算能力的提升和数据量的增长，LM的发展经历了从统计语言模型（statistical language model , SLM）到神经语言模型（ ...