最近用大模型生成html报告,或者图片。都遇到了加载慢的问题。然后核心就是引入 的echart库的速度吗。 国外的lib 基本默认配置就是国外的源。需要我们手动设置一下。比如...
最近用大模型生成html报告,或者图片。都遇到了加载慢的问题。然后核心就是引入 的echart库的速度吗。 国外的lib 基本默认配置就是国外的源。需要我们手动设置一下。比如...
海量画图下的机器卡死 非常慢,线程级别服用chrome内核,2000张图把机器卡死了。 回退版本 网上看到很多人有遇到同样的问题,high cpu,慢。我的版本plotly6...
批量删除数据 milvus 连接的问题 gprc的版本问题,导致一段时间milvus连接出错https://github.com/grpc/grpc/issues/38282...
python version 太新也是个问题 我的python是3.13版本。pip install torch 都不行。原来是太新了,没有匹配的ERROR: Could n...
目前各家大模型厂商的API接口,基本上都是参照openai的接口格式,所以不管是chat/compelete,还是function-call接口格式都是一样的,这个给不同厂家...
我们天天说想要公司的产品增长10倍,其实非常难。就拿自己做的自媒体来说,现在1k个粉丝,然后想要增长10倍到1w个粉丝。还是挺难。 自己的一点反思: 目前的商业价值量 有一点...
找重要的事件 比如给定一个主题,我们取召回素材,然后把素材给到大模型,在prompt里面让他挑选重要的事件,并总结。 效果上看,一般都会做的比较泛泛。总结的内容可能也包含多个...
tool工具的使用 当前只设定一个工作流,回答上市公司的问题,使用kimi模型,在agent 人设上要求所有问题使用工作流工具。 效果一般,agent第一步就是选择工具,比如...
向量召回的先决条件 你的query 比较明确,越具体越好。 如果是比较泛的问题,比如 xxx公司怎么样? 无论如何都不好召回。 这个时候需要好的改写,将问题具体话,比如 从主...
步骤 cp /var/lib/mysql 到新的目录 设置 mysql:mysql owner 设置 conf配置,看起来都ok。 service restart 就是起不来...
转化成int8的模型 AutoGPTQ的方式量化:https://github.com/QwenLM/Qwen/issues/464[https://github.com/Q...
工具篇 尝试各类文本生成的工具,从https://www.waytoagi.com/[https://www.waytoagi.com/]开始。 尝试了阿里妈妈的营销文本,选...
Autogent:1,适合将各个agent 拆分,组合和调用,主要在规划层面。 实际上做的事情,类似与autogpt调用各个agent,未来可能有非常多的大量agent之后,...
最新的论文或者必看榜单 2023-RAG-非常全面: Retrieval-Augmented Generation for Large Language Models: A ...
背景 比如我们有比较确定的几十类实体,并且每一类实体的值都是已知的,也就是在一个有限集合类做NER实体识别。 基于lucene的召回 把实体做成字典,比如 公司名,公司简称 ...
幻觉评测工具 factool https://github.com/GAIR-NLP/factool/issues[https://github.com/GAIR-NLP/f...
参考标准 gpt4 作为目前公开的天花板,gpt4的价格可以作为一个参考 1000token应该是英文,输入token 0.03刀,也就是10K 一万token=0.3刀=2...
现有方案 基本都是搜索的路子,将doc 中所有的文本进行向量化,然后query,将query 做成向量,然后用相似性算法去召回段落来回答问题。现有方案的缺点: 缺失了很多文档...
持续迭代的嵌入模型 论文: C-Pack: Packaged Resources To Advance General Chinese Embedding 测试效果看,比m3...