本地中文大语言模型搭建和对比
GGUF GGUF说明: GGUF和GGML的区别:
LLM 加持下生成 Kubernetes YAML 文件探索
需求 以下适合使用Kubernetes工具管理容器化应用,如果你使用Docker工具管理,可跳过。 部署一些主流的应用,如:MySQL、Redis、Jenkins等,都可以使用Helm等package工具进行快速的部署到K8S环境中。 在我上一篇文章《快速搭建本地大语言模型和知识库》中,关于 Any
快速搭建本地大语言模型和知识库
Ollama VS Hugging Face 在本地快速运行大模型,可以使用 Ollama 和 Hugging Face。 如果想通过 Hugging Face 本地快速访问大模型一般有两种方式: Inference API (Serverless)
AI Agent 实践
AIGC的趋势 未来LLM基础模型会越来越强大,而且很多小模型(huggingface models)也在蓬勃发展,再与当下企业的应用或者私有化数据进行融合,形成新的AI应用。 在运用 LLM 技术驱动的自主 Agent 系统中,LLM 承担了智能大脑的角色,且包含了三个提升其关键性能的组件:规划(
Alibaba COLA 4.0 架构实践
Alibaba COLA架构 4.0 COLA 是 Clean Object-Oriented and Layered Architecture的缩写,代表“整洁面向对象分层架构”。 目前COLA已经发展到COLA v4。 互联网业务项目一般会遇到如下一些普遍问题: 虽然整体架构规划
使用Github Actions构建流水线并使用Helm部署制品到K8S
GitHub Actions 是 Github 在2018年10月份推出的持续集成服务。可免费使用,你可以在 GitHub Actions 的仓库中自动化、自定义和执行软件开发工作流程。 可以发现、创建和共享操作以执行您喜欢的任何作业(包括 CI/CD),并将操作合并到完全自定义的工作流程中。 本文
使用 Elastic 可观测性实现云原生应用监控(4/4)
Elastic APM 是一款免费开源的应用程序性能监测工具,我们可以借助免费且开放的 Elastic APM 扩展至应用程序指标。精确查看您的应用程序都在哪里耗时了,然后便可快速修复问题,这样对发布的代码可以保持十足信心。 APM工具对比
使用 Elastic 可观测性实现云原生应用监控(3/4)
MetricBeat 是一种轻量型的指标采集器,是 Elastic Stack 的一部分,因此能够与 Elasticsearch 和 Kibana 无缝协作。Metricbeat 能够以一种轻量型的方式,从系统和服务收集指标,输送各种系统和服务统计数据。 Metricbeat 提供多种内部模块,这些
使用 Elastic 可观测性实现云原生应用监控(2/4)
本篇文章将学习如何使用 Fluent Bit 采集 Kubernetes 集群的应用日志,并将日志数据输出到ElasticSearch中,使用Kibana将其可视化出来。日志收集工具还有很多,如:Fluentd,Filebeat,Promtail等等。其中 Fluent Bit,Fluentd和 F
用 Elastic 可观测性实现云原生应用监控(1/4)
在本系列文章中,我们将学习如何使用 Elastic Stack 来实现对云原生应用的监控。该解决方案具有完备的日志、指标、APM 和可用性采集能力,可以在大规模/云原生的环境下,完成服务质量目标(SLO)的管理。 总的来说主要包括3个方面: Metrics:通过收集系统各个组件的时序数据,比如 CP