不二人生-CSDN博客

原创机器学习专栏

随着现在以ChatGPT为代表的大模型发展，人工智能、机器学习、大模型这些词逐渐火热起来了，所以是时候了解一下这些东西了，可能有的人会说不会太晚了吗，其实不晚，因为我们从来都是技术的创造者，只是技术的使用者而已，在一定程度上来说，及时的学会使用，对普通人来说就足以过上不错的日子。但是伴随着老的生产力的落幕，必然有新的生产力出现，否则整个社会的发展就陷入了停滞，其实我们可以看到现在的AI 发展的这么快，每一轮的技术发展都会有一二十年的生命周期，我们只能说传统互联网走到了夕阳西下的时候。

2024-03-30 13:11:30 166841

原创数据仓库实战教程

以hadoop 作为基础生态，从0到进行数仓建设，主要分为基础篇和实战篇两部分，基础篇主要是各种组件的学习和案例，实战篇主要是三家企业的数仓设计案例，最后是扩展篇主要是实时数仓。

2020-12-28 09:19:07 219979 18

原创 Java集合汇总篇

一. 集合框架Java 集合框架一些列的接口和类来实现很多常见的数据结构和算法，例如 LinkedList 就是集合框架提供的实现了双向链表的数据结构，关于这一篇文章建议大家收藏，我会不断地完善和扩充它的内容，例如最下面的系列文章我以后也会对它进行不断的更新集合框架的接口集合框架提供了很多接口，这些接口都包含了特定的方法来实现对集合上的特定操作)我们将要学习这些接口以及子接口和它们的各种实现类，在开始之前我们先简单学习一下这些广泛运用的接口，可以看到整个集合框架，总共有三个顶级接口Collecti

2020-12-13 20:25:05 219695 3

原创 DeepSeek掘金——DeepSeek R1驱动的PDF机器人

本指南将引导你使用DeepSeek R1 + RAG构建一个功能性的PDF聊天机器人。逐步学习如何增强AI检索能力，并创建一个能够高效处理和响应文档查询的智能聊天机器人。本指南将引导你使用DeepSeek R1 + RAG构建一个功能性的PDF聊天机器人。逐步学习如何增强AI检索能力，并创建一个能够高效处理和响应文档查询的智能聊天机器人。想象一下：您刚刚部署了一个聊天机器人来处理客户查询，但与其让用户印象深刻，它却在基本问题上磕磕绊绊，吐出无关的答案，甚至更糟——完全捏造虚假信息。听起来熟悉吗？

2025-03-01 07:55:13 168

原创 DeepSeek掘金——DeepSeek R1驱动的简历自动分析，在人事行业的应用

本文深入探讨了通过 Together.ai 平台集成 DeepSeek R1 以创建 Resume Roaster 的过程——一种用于详细简历审查的 AI 驱动工具。DeepSeek R1 已用于通过自动化简历审查和为招聘经理提供可操作的见解来简化招聘流程。这些模型在理解和处理结构化文档方面表现出色，使其对于简历分析等任务非常有用。本文深入探讨了通过 Together.ai 平台集成 DeepSeek R1 以创建 Resume Roaster 的过程——一种用于详细简历审查的 AI 驱动工具。

2025-03-01 07:52:51 84

原创 Coze——通过模板搭建智能体

将智能体模板复制到工作空间之后，就可以对智能体进行定制化修改和改造，让智能体更符合你的个人需求与真实场景。复制过来后我们就可以在我们的工作空间中可以看到，然后就可以对它进行编辑。复制模板后，你会拥有一个与模板配置完全一样的智能体，并将其改造为更适合自己的应用。例如修改智能体的人设与编排逻辑、为智能体添加插件、工作流、数据库等配置，并在预览与调试区域通过对话调试效果。在对话页面，体验该智能体功能。将智能体发布到各种渠道中，在终端应用中使用智能体。设置智能体的名称和所在的工作空间，并单击。

2025-03-01 07:43:52 81

原创 Coze——搭建一个AI 助手智能体

无论你是否有编程基础，你都可以在扣子平台快速搭建一个 AI 智能体。本文以一个夸夸机器人为例演示如何在扣子平台搭建智能体。

2025-02-28 17:33:04 384

原创 Coze——什么是扣子

扣子是新一代 AI 应用开发平台。无论你是否有编程基础，都可以在扣子上快速搭建基于大模型的各类 AI 应用，并将 AI 应用发布到各个社交平台、通讯软件，也可以通过 API 或 SDK 将 AI 应用集成到你的业务系统中。

2025-02-28 17:31:47 277

原创大模型核心技术解析：参数量、量化、Zero版本与模型蒸馏

我们经常会看到大模型后面，会跟一个奇怪的后缀，如：1.5b7b8b14b32b70b671b在深度学习领域，“参数量”（Parameters）指模型中所有可调整的权重（Weights）和偏置（Bias）的总数量。1.5b：15亿参数70b：700亿参数671b：6710亿参数这里的"b"代表十亿（billion），是衡量模型规模的直接指标。例如，一个全连接层的参数量计算公式为：参数量 = 输入维度 × 输出维度 + 输出维度（偏置项）

2025-02-28 13:53:48 345

原创 DeepSeek掘金——DeepSeek R1架构和训练过程图解

为了让一切变得简单，我们将使用手绘流程图和简单的计算来帮助从头开始澄清DeeoSeek-R1的核心概念。如果你对 AI 感兴趣，可能听说过 DeepSeek R1。它目前在 LLM 领域很流行，并且表现优于开源和闭源模型。为了让一切变得简单，我们将使用手绘流程图和简单的计算来帮助从头开始澄清DeeoSeek-R1的核心概念。事实上，我们将在整个博客中使用字符串 2 + 3 * 4 等于多少？作为示例，引导你了解 DeepSeek 技术报告的每个组成部分。

2025-02-28 10:05:18 588

原创 DeepSearch 与 DeepResearch 的设计和实现

DeepSearch 的核心理念是通过在搜索、阅读和推理三个环节中不断循环往复，直到找到最优答案。搜索环节利用搜索引擎探索互联网，而阅读环节则专注于对特定网页进行详尽的分析（例如使用 Jina Reader）。推理环节则负责评估当前的状态，并决定是应该将原始问题拆解为更小的子问题，还是尝试其他的搜索策略。DeepSearch - 持续搜索、阅读网页、推理，直到找到答案（或超出 token 预算)。

2025-02-28 09:27:55 419

原创大模型系列——AI驱动的README生成器效率翻倍

Post-Commit钩子是每个git提交之后运行的脚本。生成README.md文件。使用Llama 3模型对项目进行全面描述。自动提交README.md文件，使用标志机制避免无限循环。

2025-02-27 08:16:44 954

原创大模型系列——专家混合模型 (MoE)快速指南

在 GPU 和数据密集型 LLM 的世界中，在各种宝贵资源之间找到平衡非常重要。例如，如果我们希望 LLM 在各种任务中表现出色，可以通过增加参数数量来实现，这反过来会使推理（以及训练）更耗费计算资源。MoE 的出现是为了创建一个规模大、能力强但在推理阶段要求稍低的 LLM。MoE 建议拥有多个（例如 8 个）独立版本的前馈块 (FFN) — “专家” — 以及一个路由器，该路由器决定针对每个特定 token 使用哪个（例如 2 个）专家。你可能会问，“为什么只使用 FFN，而不使用自注意力？

2025-02-27 08:15:29 1053

原创大模型系列——正式推出 Spring AI MCP：用于 MCP（模型上下文协议）的 Java SDK

我们很高兴推出 Spring AI MCP，它是模型上下文协议（Model Context Protocol，）的强大 Java SDK 实现。Spring AI生态系统的这一新成员为 Java 平台带来了标准化的 AI 模型集成能力。

2025-02-27 08:13:27 987

原创大模型——程序员AI淘金综合指南

还有大量其他模型，从音乐生成器到图像分类器。我甚至还没有介绍计算机视觉和图像分类，因为这已经成为常态。我无法深入研究所有的人工智能和机器学习模型。这会让这篇文章变成一本完整的书，而这本书一出版就会过时。对于 iOS、iPhone、iPad 和 macOS 用户来说，一个重要的工具是苹果自己的Create ML。与 TensorFlow 以及 AWS、Google Cloud 和 Azure 上的所有机器学习工具相比，它看起来就像一个玩具。尤其是用 Python。这很好，因为这些模型可以使用苹果的。

2025-02-26 11:25:09 1294

原创大模型——产品图片背景替换AI工具

在亚马逊等平台上经营自己的商店时，处理大量的产品图片很快就会成为一项具有挑战性且耗时的任务。大家好！迫不及待地想分享新的 AI 内容！😉今天的重点是产品图片的背景替换，这是一个对在线商店非常有价值的工具。当你在亚马逊等平台上经营自己的商店时，处理大量的产品图片很快就会成为一项具有挑战性且耗时的任务。更不用说聘请设计团队来处理所有产品图片处理的巨大成本了。但现在，在人工智能的帮助下，一切都可以简化并高效完成。你所需要的只是找到适合你需求的正确 AI 设计工具。

2025-02-26 11:23:17 1260

原创 DeepSeek掘金——DeepSeek Janus系列多模态模型

DeepSeek 的 Janus是一系列统一的多模态模型，结合了视觉和语言功能。与专注于文本到图像合成或视觉语言任务的传统模型不同，Janus-Series 无缝集成了这两种功能。多模态理解：可以处理文本和图像，实现深度上下文理解。文本到图像生成：类似于 OpenAI 的 DALL-E 3，但开源且针对效率进行了优化。统一 Transformer 架构：使用单个 Transformer 执行文本和视觉任务。可扩展性：支持针对不同硬件功能量身定制的多种模型大小。

2025-02-26 11:21:27 1898

原创 DeepSeek掘金——DeepSeek Janus Pro 7B

在本文中，我们将探讨 Janus-Pro-7B 的架构、功能、训练方法和潜在应用。此外，我们将提供在实际应用中利用此模型的代码片段。Deep Seek Janus-Pro-7B 是一种创新的大型语言模型 (LLM)，在人工智能社区掀起了波澜。Janus-Pro-7B 专为各种复杂任务而设计，在自然语言理解、推理和生成方面表现出色。在本文中，我们将探讨 Janus-Pro-7B 的架构、功能、训练方法和潜在应用。此外，我们将提供在实际应用中利用此模型的代码片段。架构和设计。

2025-02-26 11:20:17 1241

原创 DeepSeek掘金——DeepSeek API+SearXNG联网搜索

在这篇文章中，我将提供一个快速概述，说明如何使用开源的DeepSeek R1模型和SearXNG搜索引擎在本地搭建一个能够进行网络搜索的聊天机器人。在这篇文章中，我将提供一个快速概述，说明如何使用开源的DeepSeek R1模型在本地搭建一个能够进行网络搜索的聊天机器人。这将是一项相当技术性的任务，我在考虑时感到很困难，因为通讯定位为以非技术性的方式解释技术内容，但为了帮助那些想开始AI之旅的人们，我还是决定写这篇文章。我尽力以非技术性的方式解释（因为我们是半专家，对吧？

2025-02-26 11:18:54 1309

原创 DeepSeek掘金——SearpApi联网搜索给DeepSeek插上翅膀

本地部署的DeepSeek API没有联网搜索功能，因此我们需要自己实现，这就是本教程的目的。我找不到 DeepSeek 的知识截止日期，所以我直接问了 DeepSeek：DeepSeek 对知识截止日期的回复如你所见，它的最新知识来自 2024 年 7 月，它建议使用互联网访问获取最新信息。如果你直接使用该平台，可以激活“搜索”功能来搜索网络：DeepSeek 中的 Web 搜索功能但如果使用 API，则需要找到一种变通方法，这就是我们将在本线程中讨论的内容！

2025-02-25 10:48:21 2093

原创 DeepSeek掘金—— Deepseek × SeaTunnel 引领下一代智能数据集成革命

在数据与大模型交汇的时代浪潮中，Apache SeaTunnel以开源之力重新定义了数据集成工具的边界。无论是降低AI应用门槛，还是加速企业智能化转型，SeaTunnel正成为开发者与企业的首选武器。立即行动，搭乘这趟开往未来的数据快车，共同书写智能时代的新篇章！

2025-02-25 10:46:08 1715

原创 DeepSeek掘金——CodeGPT集成DeepSeek-R1 写代码的效率起飞了

本指南将向你展示如何在本地安装和运行 DeepSeek、使用 CodeGPT 对其进行配置以及开始利用 AI 来增强你的软件开发工作流程，所有这些都无需依赖基于云的服务。本分步指南将向你展示如何在本地安装和运行 DeepSeek、使用 CodeGPT 对其进行配置以及开始利用 AI 来增强你的软件开发工作流程，所有这些都无需依赖基于云的服务。

2025-02-25 10:45:02 1593

原创 DeepSeek掘金——蒸馏DeepSeek-R1到自己的模型

蒸馏是一种机器学习技术，其中较小的模型（“学生”）经过训练以模仿较大的预训练模型（“老师”）的行为。目标是保留老师的大部分表现，同时显着降低计算成本和内存占用。这个想法最早是在 Geoffrey Hinton 关于知识蒸馏的开创性论文中提出的。它不是直接在原始数据上训练学生模型，而是从老师模型的输出或中间表示中学习。这实际上是受到人类教育的启发。成本效率：较小的模型需要更少的计算资源。速度：非常适合延迟敏感的应用程序（例如 API、边缘设备）。

2025-02-24 08:56:35 2401

原创 DeepSeek掘金——在CPU上运行DeepSeek-R1

在 CPU 上运行 LLM 提供了一种扩大可访问性的替代方案，允许更多用户在现有硬件上利用 AI。本指南探讨了在 CPU 上有效使用 DeepSeek R1 的方法。随着对 AI 驱动应用程序的需求不断增长，大型语言模型 (LLM) 已成为各个领域的重要工具。然而，大多数这些模型都需要强大的 GPU 才能有效运行，这使得许多用户无法使用它们。并不是每个人都能买得起高端 GPU，而且从长远来看，云服务的成本可能很高。

2025-02-24 08:55:04 1998

原创 AI 编程工具—Cursor 实战篇 IOS 换脸软件

首先我们用Cursor 打开刚才的项目，然后重新索引一下，如果不知道这个什么意思，可以看我们之前的文章。imgbb的地址如下，因为我们的工作流的参数，也就是图片是地址，所以这里我们需要一个图片服务器。这里我们可以创建两个Doc, 如果不知道Doc 是什么，可以看我们之前的文档。这里我们把运行之前的图片和运行之后的图片放在了一起方便对比。我们可以切换一下我们的运行环境，选择"iphone"这里我们需要token ，然后测试一下我们的工作流。最后我们可以测试一下，这里的这个请求我们后面用得到。

2025-02-23 20:07:05 2084

原创 DeepSeek掘金——用DeepSeek模型构建AI 代理

在本综合指南中，我们将探讨如何利用 DeepSeek 的功能构建能够以有意义的方式理解、推理和交互的复杂 AI 代理。人工智能领域正在迅速发展，DeepSeek 的模型代表了智能 AI 代理开发的重大进步。在本综合指南中，我们将探讨如何利用 DeepSeek 的功能构建能够以有意义的方式理解、推理和交互的复杂 AI 代理。

2025-02-23 10:13:35 2161

原创 DeepSeek掘金——用Deepseek-R1蒸馏自己的模型

为了举例说明，我希望模型能够遍历我的数据集，理解每个意见的情感，并从-5到5对每个意见进行排名，并将其添加到新的列中。总之，上述指南为你提供了一个简单的方法来创建最新精馏Deepseek-R1模型的本地私有实例，并展示了如何创建自定义提示以在自己的数据上以可扩展的方式运行。通过使用pandas的apply()函数，我可以使用上述指定的函数针对数据框中的所有行运行模型，并结合辅助系统提示来帮助指导模型产生正确的输出。确保指定正确的模型。只需在>>>后面直接写入你的提示，就可以开始与你的模型的本地版本互动。

2025-02-23 10:12:40 2157

数据仓库理论与实战(适用于从事数仓方向的小伙伴)

关于枚举你都知道什么呢？

有没有一个讲Java 集合的系列文章

有没有一个将Java 结合的系列文章

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.