自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(816)
  • 资源 (1)
  • 问答 (3)
  • 收藏
  • 关注

原创 机器学习 专栏

随着现在以ChatGPT为代表的大模型发展,人工智能、机器学习、大模型 这些词逐渐火热起来了,所以是时候了解一下这些东西了,可能有的人会说不会太晚了吗,其实不晚,因为我们从来都是技术的创造者,只是技术的使用者而已,在一定程度上来说,及时的学会使用,对普通人来说就足以过上不错的日子。但是伴随着老的生产力的落幕,必然有新的生产力出现,否则整个社会的发展就陷入了停滞,其实我们可以看到现在的AI 发展的这么快,每一轮的技术发展都会有一二十年的生命周期,我们只能说传统互联网走到了夕阳西下的时候。

2024-03-30 13:11:30 166841

原创 数据仓库实战教程

以hadoop 作为基础生态,从0到进行数仓建设,主要分为基础篇和实战篇两部分,基础篇主要是各种组件的学习和案例,实战篇主要是三家企业的数仓设计案例,最后是扩展篇主要是实时数仓。

2020-12-28 09:19:07 219979 18

原创 Java集合汇总篇

一. 集合框架Java 集合框架一些列的接口和类来实现很多常见的数据结构和算法,例如 LinkedList 就是集合框架提供的实现了双向链表的数据结构,关于这一篇文章建议大家收藏,我会不断地完善和扩充它的内容,例如最下面的系列文章我以后也会对它进行不断的更新集合框架的接口集合框架提供了很多接口,这些接口都包含了特定的方法来实现对集合上的特定操作)我们将要学习这些接口以及子接口和它们的各种实现类,在开始之前我们先简单学习一下这些广泛运用的接口,可以看到整个集合框架,总共有三个顶级接口Collecti

2020-12-13 20:25:05 219695 3

原创 DeepSeek掘金——DeepSeek R1驱动的PDF机器人

本指南将引导你使用DeepSeek R1 + RAG构建一个功能性的PDF聊天机器人。逐步学习如何增强AI检索能力,并创建一个能够高效处理和响应文档查询的智能聊天机器人。本指南将引导你使用DeepSeek R1 + RAG构建一个功能性的PDF聊天机器人。逐步学习如何增强AI检索能力,并创建一个能够高效处理和响应文档查询的智能聊天机器人。想象一下:您刚刚部署了一个聊天机器人来处理客户查询,但与其让用户印象深刻,它却在基本问题上磕磕绊绊,吐出无关的答案,甚至更糟——完全捏造虚假信息。听起来熟悉吗?

2025-03-01 07:55:13 168

原创 DeepSeek掘金——DeepSeek R1驱动的简历自动分析,在人事行业的应用

本文深入探讨了通过 Together.ai 平台集成 DeepSeek R1 以创建 Resume Roaster 的过程——一种用于详细简历审查的 AI 驱动工具。DeepSeek R1 已用于通过自动化简历审查和为招聘经理提供可操作的见解来简化招聘流程。这些模型在理解和处理结构化文档方面表现出色,使其对于简历分析等任务非常有用。本文深入探讨了通过 Together.ai 平台集成 DeepSeek R1 以创建 Resume Roaster 的过程——一种用于详细简历审查的 AI 驱动工具。

2025-03-01 07:52:51 84

原创 Coze——通过模板搭建智能体

将智能体模板复制到工作空间之后,就可以对智能体进行定制化修改和改造,让智能体更符合你的个人需求与真实场景。复制过来后我们就可以在我们的工作空间中可以看到,然后就可以对它进行编辑。复制模板后,你会拥有一个与模板配置完全一样的智能体,并将其改造为更适合自己的应用。例如修改智能体的人设与编排逻辑、为智能体添加插件、工作流、数据库等配置,并在预览与调试区域通过对话调试效果。在对话页面,体验该智能体功能。将智能体发布到各种渠道中,在终端应用中使用智能体。设置智能体的名称和所在的工作空间,并单击。

2025-03-01 07:43:52 81

原创 Coze——搭建一个AI 助手智能体

无论你是否有编程基础,你都可以在扣子平台快速搭建一个 AI 智能体。本文以一个夸夸机器人为例演示如何在扣子平台搭建智能体。

2025-02-28 17:33:04 384

原创 Coze——什么是扣子

扣子是新一代 AI 应用开发平台。无论你是否有编程基础,都可以在扣子上快速搭建基于大模型的各类 AI 应用,并将 AI 应用发布到各个社交平台、通讯软件,也可以通过 API 或 SDK 将 AI 应用集成到你的业务系统中。

2025-02-28 17:31:47 277

原创 大模型核心技术解析:参数量、量化、Zero版本与模型蒸馏

我们经常会看到大模型后面,会跟一个奇怪的后缀,如:1.5b7b8b14b32b70b671b在深度学习领域,“参数量”(Parameters)指模型中所有可调整的权重(Weights)和偏置(Bias)的总数量。1.5b:15亿参数70b:700亿参数671b:6710亿参数这里的"b"代表十亿(billion),是衡量模型规模的直接指标。例如,一个全连接层的参数量计算公式为:参数量 = 输入维度 × 输出维度 + 输出维度(偏置项)

2025-02-28 13:53:48 345

原创 DeepSeek掘金——DeepSeek R1架构和训练过程图解

为了让一切变得简单,我们将使用手绘流程图和简单的计算来帮助从头开始澄清DeeoSeek-R1的核心概念。如果你对 AI 感兴趣,可能听说过 DeepSeek R1。它目前在 LLM 领域很流行,并且表现优于开源和闭源模型。为了让一切变得简单,我们将使用手绘流程图和简单的计算来帮助从头开始澄清DeeoSeek-R1的核心概念。事实上,我们将在整个博客中使用字符串 2 + 3 * 4 等于多少?作为示例,引导你了解 DeepSeek 技术报告的每个组成部分。

2025-02-28 10:05:18 588

原创 DeepSearch 与 DeepResearch 的设计和实现

DeepSearch 的核心理念是通过在搜索、阅读和推理三个环节中不断循环往复,直到找到最优答案。搜索环节利用搜索引擎探索互联网,而阅读环节则专注于对特定网页进行详尽的分析(例如使用 Jina Reader)。推理环节则负责评估当前的状态,并决定是应该将原始问题拆解为更小的子问题,还是尝试其他的搜索策略。DeepSearch - 持续搜索、阅读网页、推理,直到找到答案(或超出 token 预算)。

2025-02-28 09:27:55 419

原创 大模型系列——AI驱动的README生成器 效率翻倍

Post-Commit钩子是每个git提交之后运行的脚本。生成README.md文件。使用Llama 3模型对项目进行全面描述。自动提交README.md文件,使用标志机制避免无限循环。

2025-02-27 08:16:44 954

原创 大模型系列——专家混合模型 (MoE)快速指南

在 GPU 和数据密集型 LLM 的世界中,在各种宝贵资源之间找到平衡非常重要。例如,如果我们希望 LLM 在各种任务中表现出色,可以通过增加参数数量来实现,这反过来会使推理(以及训练)更耗费计算资源。MoE 的出现是为了创建一个规模大、能力强但在推理阶段要求稍低的 LLM。MoE 建议拥有多个(例如 8 个)独立版本的前馈块 (FFN) — “专家” — 以及一个路由器,该路由器决定针对每个特定 token 使用哪个(例如 2 个)专家。你可能会问,“为什么只使用 FFN,而不使用自注意力?

2025-02-27 08:15:29 1053

原创 大模型系列——正式推出 Spring AI MCP:用于 MCP(模型上下文协议)的 Java SDK

我们很高兴推出 Spring AI MCP,它是模型上下文协议(Model Context Protocol,)的强大 Java SDK 实现。Spring AI生态系统的这一新成员为 Java 平台带来了标准化的 AI 模型集成能力。

2025-02-27 08:13:27 987

原创 大模型——程序员AI淘金综合指南

还有大量其他模型,从音乐生成器到图像分类器。我甚至还没有介绍计算机视觉和图像分类,因为这已经成为常态。我无法深入研究所有的人工智能和机器学习模型。这会让这篇文章变成一本完整的书,而这本书一出版就会过时。对于 iOS、iPhone、iPad 和 macOS 用户来说,一个重要的工具是苹果自己的Create ML。与 TensorFlow 以及 AWS、Google Cloud 和 Azure 上的所有机器学习工具相比,它看起来就像一个玩具。尤其是用 Python。这很好,因为这些模型可以使用苹果的。

2025-02-26 11:25:09 1294

原创 大模型——产品图片背景替换AI工具

在亚马逊等平台上经营自己的商店时,处理大量的产品图片很快就会成为一项具有挑战性且耗时的任务。大家好!迫不及待地想分享新的 AI 内容!😉今天的重点是产品图片的背景替换,这是一个对在线商店非常有价值的工具。当你在亚马逊等平台上经营自己的商店时,处理大量的产品图片很快就会成为一项具有挑战性且耗时的任务。更不用说聘请设计团队来处理所有产品图片处理的巨大成本了。但现在,在人工智能的帮助下,一切都可以简化并高效完成。你所需要的只是找到适合你需求的正确 AI 设计工具。

2025-02-26 11:23:17 1260

原创 DeepSeek掘金——DeepSeek Janus系列多模态模型

DeepSeek 的 Janus是一系列统一的多模态模型,结合了视觉和语言功能。与专注于文本到图像合成或视觉语言任务的传统模型不同,Janus-Series 无缝集成了这两种功能。多模态理解:可以处理文本和图像,实现深度上下文理解。文本到图像生成:类似于 OpenAI 的 DALL-E 3,但开源且针对效率进行了优化。统一 Transformer 架构:使用单个 Transformer 执行文本和视觉任务。可扩展性:支持针对不同硬件功能量身定制的多种模型大小。

2025-02-26 11:21:27 1898

原创 DeepSeek掘金——DeepSeek Janus Pro 7B

在本文中,我们将探讨 Janus-Pro-7B 的架构、功能、训练方法和潜在应用。此外,我们将提供在实际应用中利用此模型的代码片段。Deep Seek Janus-Pro-7B 是一种创新的大型语言模型 (LLM),在人工智能社区掀起了波澜。Janus-Pro-7B 专为各种复杂任务而设计,在自然语言理解、推理和生成方面表现出色。在本文中,我们将探讨 Janus-Pro-7B 的架构、功能、训练方法和潜在应用。此外,我们将提供在实际应用中利用此模型的代码片段。架构和设计。

2025-02-26 11:20:17 1241

原创 DeepSeek掘金——DeepSeek API+SearXNG联网搜索

在这篇文章中,我将提供一个快速概述,说明如何使用开源的DeepSeek R1模型和SearXNG搜索引擎在本地搭建一个能够进行网络搜索的聊天机器人。在这篇文章中,我将提供一个快速概述,说明如何使用开源的DeepSeek R1模型在本地搭建一个能够进行网络搜索的聊天机器人。这将是一项相当技术性的任务,我在考虑时感到很困难,因为通讯定位为以非技术性的方式解释技术内容,但为了帮助那些想开始AI之旅的人们,我还是决定写这篇文章。我尽力以非技术性的方式解释(因为我们是半专家,对吧?

2025-02-26 11:18:54 1309

原创 DeepSeek掘金——SearpApi联网搜索 给DeepSeek插上翅膀

本地部署的DeepSeek API没有联网搜索功能,因此我们需要自己实现,这就是本教程的目的。我找不到 DeepSeek 的知识截止日期,所以我直接问了 DeepSeek:DeepSeek 对知识截止日期的回复如你所见,它的最新知识来自 2024 年 7 月,它建议使用互联网访问获取最新信息。如果你直接使用该平台,可以激活“搜索”功能来搜索网络:DeepSeek 中的 Web 搜索功能但如果使用 API,则需要找到一种变通方法,这就是我们将在本线程中讨论的内容!

2025-02-25 10:48:21 2093

原创 DeepSeek掘金—— Deepseek × SeaTunnel 引领下一代智能数据集成革命

在数据与大模型交汇的时代浪潮中,Apache SeaTunnel以开源之力重新定义了数据集成工具的边界。无论是降低AI应用门槛,还是加速企业智能化转型,SeaTunnel正成为开发者与企业的首选武器。立即行动,搭乘这趟开往未来的数据快车,共同书写智能时代的新篇章!

2025-02-25 10:46:08 1715

原创 DeepSeek掘金——CodeGPT集成DeepSeek-R1 写代码的效率起飞了

本指南将向你展示如何在本地安装和运行 DeepSeek、使用 CodeGPT 对其进行配置以及开始利用 AI 来增强你的软件开发工作流程,所有这些都无需依赖基于云的服务。本分步指南将向你展示如何在本地安装和运行 DeepSeek、使用 CodeGPT 对其进行配置以及开始利用 AI 来增强你的软件开发工作流程,所有这些都无需依赖基于云的服务。

2025-02-25 10:45:02 1593

原创 DeepSeek掘金——蒸馏DeepSeek-R1到自己的模型

蒸馏是一种机器学习技术,其中较小的模型(“学生”)经过训练以模仿较大的预训练模型(“老师”)的行为。目标是保留老师的大部分表现,同时显着降低计算成本和内存占用。这个想法最早是在 Geoffrey Hinton 关于知识蒸馏的开创性论文中提出的。它不是直接在原始数据上训练学生模型,而是从老师模型的输出或中间表示中学习。这实际上是受到人类教育的启发。成本效率:较小的模型需要更少的计算资源。速度:非常适合延迟敏感的应用程序(例如 API、边缘设备)。

2025-02-24 08:56:35 2401

原创 DeepSeek掘金——在CPU上运行DeepSeek-R1

在 CPU 上运行 LLM 提供了一种扩大可访问性的替代方案,允许更多用户在现有硬件上利用 AI。本指南探讨了在 CPU 上有效使用 DeepSeek R1 的方法。随着对 AI 驱动应用程序的需求不断增长,大型语言模型 (LLM) 已成为各个领域的重要工具。然而,大多数这些模型都需要强大的 GPU 才能有效运行,这使得许多用户无法使用它们。并不是每个人都能买得起高端 GPU,而且从长远来看,云服务的成本可能很高。

2025-02-24 08:55:04 1998

原创 AI 编程工具—Cursor 实战篇 IOS 换脸软件

首先我们用Cursor 打开刚才的项目,然后重新索引一下,如果不知道这个什么意思,可以看我们之前的文章。imgbb的地址如下,因为我们的工作流的参数,也就是图片是地址,所以这里我们需要一个图片服务器。这里我们可以创建两个Doc, 如果不知道Doc 是什么,可以看我们之前的文档。这里我们把运行之前的图片和运行之后的图片放在了一起方便对比。我们可以切换一下我们的运行环境,选择"iphone"这里我们需要token ,然后测试一下我们的工作流。最后我们可以测试一下,这里的这个请求我们后面用得到。

2025-02-23 20:07:05 2084

原创 DeepSeek掘金——用DeepSeek模型构建AI 代理

在本综合指南中,我们将探讨如何利用 DeepSeek 的功能构建能够以有意义的方式理解、推理和交互的复杂 AI 代理。人工智能领域正在迅速发展,DeepSeek 的模型代表了智能 AI 代理开发的重大进步。在本综合指南中,我们将探讨如何利用 DeepSeek 的功能构建能够以有意义的方式理解、推理和交互的复杂 AI 代理。

2025-02-23 10:13:35 2161

原创 DeepSeek掘金——用Deepseek-R1蒸馏自己的模型

为了举例说明,我希望模型能够遍历我的数据集,理解每个意见的情感,并从-5到5对每个意见进行排名,并将其添加到新的列中。总之,上述指南为你提供了一个简单的方法来创建最新精馏Deepseek-R1模型的本地私有实例,并展示了如何创建自定义提示以在自己的数据上以可扩展的方式运行。通过使用pandas的apply()函数,我可以使用上述指定的函数针对数据框中的所有行运行模型,并结合辅助系统提示来帮助指导模型产生正确的输出。确保指定正确的模型。只需在>>>后面直接写入你的提示,就可以开始与你的模型的本地版本互动。

2025-02-23 10:12:40 2157

原创 DeepSeek掘金——基于DeepSeek-R1构建文档问答机器人

在这个项目中,我们将结合本地 AI 的隐私与 Deepseek R1 的智能,创建一个完全本地化、推理驱动的问答机器人。在人工智能 (AI) 日益融入我们日常生活的时代,一个问题仍然处于最前沿:隐私。尽管基于云的 AI 系统功能强大,但它们通常伴随着重大的权衡——你的数据在远程服务器上处理,这引发了对安全性和机密性的质疑。对于许多应用程序,尤其是那些处理敏感信息的应用程序,这根本是不可接受的。如果我们能够利用人工智能的力量,同时将所有内容保持在本地,确保你的数据永远不会离开您的机器,那会怎样?

2025-02-23 10:04:28 2425

原创 DeepSeek掘金——基于DeepSeek R1的RAG实战

本指南将向你展示如何使用开源推理工具 DeepSeek R1 和用于运行本地 AI 模型的轻量级框架 Ollama 构建检索增强生成 (RAG) 系统。你是否曾希望直接向 PDF 或技术手册提问?本指南将向你展示如何使用开源推理工具 DeepSeek R1 和用于运行本地 AI 模型的轻量级框架 Ollama 构建检索增强生成 (RAG) 系统。

2025-02-23 09:40:24 2132

原创 DeepSeek掘金——构建Deepseek AI邮件代理

实时获取电子邮件。将其分类为垃圾邮件、紧急、需要审查和信息性类别。为每封电子邮件生成摘要。使用摘要来撰写适当的回复。根据用户输入发送或草拟回复。虽然是关键组件,但我们还需要其他工具来构建此系统。主要使用的三个工具是LangChainLangGraph和IMAP服务器。生成电子邮件内容的简短摘要。将摘要传递给响应节点进行处理。

2025-02-23 09:39:16 2133

原创 大模型——LangMem 让AI代理有记忆

你可以使用。

2025-02-22 16:03:04 2180

原创 DeepSeek掘金——DeepSeek-R1+ML混合欺诈检测

在数字交易占主导地位的时代,欺诈已成为一种复杂且无处不在的威胁。到2026年,,仅在美国,每14秒就发生一起身份盗窃案。随着犯罪分子利用人工智能(AI)发起前所未有的攻击,企业面临一个紧迫的问题:他们如何才能在这场高风险竞赛中保持领先?今天,我们将探讨当配备传统的机器学习模型和推理大型语言模型引擎时,如何使欺诈检测更加可解释和稳健。这是一场军备竞赛:欺诈者正在利用AI驱动的卡测试扩大业务规模,逃避检测,并利用零日漏洞,而防御者(好人)需要同样或更好的自适应工具来保持领先一步。

2025-02-22 15:57:23 2183

原创 DeepSeek掘金——使用DeepSeek-R1构建生成式AI应用

在这篇文章中,我们将使用DeepSeek开源模型构建一个生成式AI应用程序,该模型能够根据我们的需求生成代码和其他内容。在这篇文章中,我们将使用DeepSeek开源模型构建一个生成式AI应用程序,该模型能够根据我们的需求生成代码和其他内容。在构建此应用程序时,我们将使用Langchain(AI工作流框架)、Ollama和DeepSeek-R1等开源工具。为什么我们使用DeepSeek-R1、Langchain和Ollama?

2025-02-22 15:54:39 2172

原创 大模型——使用 Redis 和 Spring AI 创建 RAG(检索增强生成)应用

本文介绍了使用 Spring AI 框架实现基于 RAG 架构的应用。利用上下文信息形成提示对于从 LLM 生成正确的响应至关重要。因此,Redis Vector(向量)数据库是存储和执行文档向量相似性搜索的绝佳解决方案。此外,对文档进行分块处理对于获取正确的记录和限制提示 Token 的成本也同样重要。

2025-02-22 09:47:24 2275

原创 DeepSeek掘金——腾讯IMA 与 DeepSeek- R1 构筑的个人知识库

腾讯 IMA 与 DeepSeek-r1 满血版的完美结合,无疑是个人知识库的理想解决方案。它无需繁琐的部署流程,也不用担心 API 调用的不稳定,为职场人和学生党提供了一个高效、智能的知识管理与运用平台,助力我们在职场与学业的道路上披荆斩棘,不断前行。

2025-02-22 09:45:35 2246

原创 DeepSeek掘金—— Cursor+DeepSeek小红书海报生成网站开发

页面描述,只是输入了我们想要的文本信息,因为这里我们是生成小红书海报的,所以我们需要在请求大模型的时候,对页面描述信息进行补充,方便大模型更好的生成页面信息。对于很多做自媒体的人而言,做图其实是非常常见的,尤其是小红书,小红书的高质量笔记要求至少三张图,很多时候我们要做文字图片,就是图片中主要是文字介绍产品。我们先看一下效果,首先是我们有个页面描述,然后点击生成代码,生成的是HTML 代码,然后我们点击预览,就可以看得到预览效果。这两个地方我们都是需要使用大模型的,这里我选择的是。

2025-02-22 09:43:36 2158

原创 数仓建模—Deepseek + Lakehouse 架构 加速企业数字化转型 降本增效

说到大语言模型,不得不提OpenAI。作为行业的开创者,OpenAI用ChatGPT展示了大语言模型的惊人潜力。但有趣的是,在技术发展道路上,OpenAI选择了一条相对封闭的路线。Deepseek选择了一个与众不同的姿态——开放共享。当笔者深入研读Deepseek的技术文档时,不禁为其披露技术细节的诚意所打动。相比之下,回想前几年研究OpenAI发布的论文时,核心技术细节往往语焉不详。

2025-02-22 09:41:32 2166

原创 MarkItDown深入研究 ——各种文件都可转成Markdown

MarkItDown 是 Microsoft 开发的 Python 包,旨在将各种文件格式转换为 Markdown。是 Microsoft 开发的 Python 包,旨在将各种文件格式转换为 Markdown。自首次亮相以来,该库的人气飙升,在短短两周内就获得了超过 25,000 个 GitHub 星!🤯。

2025-02-22 09:25:42 2155

原创 Ollama-OCR 简明教程 让你快速识别发票 识别图片上的文字信息

Llama 3.2-Vision 是一个多模态大型语言模型,有 11B 和 90B 两种大小,能够处理文本和图像输入以生成文本输出。该模型在视觉识别、图像推理、图像描述和回答与图像相关的问题方面表现出色,在多个行业基准测试中优于现有的开源和闭源多模态模型。在本文中,我将介绍如何调用由 Ollama 运行的 Llama 3.2-Vision 11B 建模服务并使用实现图像文本识别 (OCR) 功能。

2025-02-22 09:22:58 2208

原创 AI 编程工具—Cursor 实战篇 背单词网站应用开发

虽然这是一个相对简单的示例项目,但它展示了 AI 辅助开发的基本流程和方法。1、交互策略与Cursor进行清晰、具体的对话将复杂需求拆分成小步骤及时反馈和纠正AI的输出2、效率提升善用上下文管理,保持对话连贯性复用已验证的代码片段建立个人的提示词模板​。

2025-02-21 17:34:54 2154

数据仓库理论与实战(适用于从事数仓方向的小伙伴)

数据仓库理论与实战(适用于从事数仓方向的小伙伴)

2022-02-15

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除
pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy