240 发简信
IP属地:广东
  • 120
    风险策略小结_简版

    风险就是损失的可能性,风险经营就是平衡损失的可能性和收益期望,风险策略是具体的抓手。 一、策略体系的构建 目标:满足实际的业务需求。 策略架构搭建 熟悉产品类型,了解进件流程...

  • 120
    模型性能评估_交叉验证(Cross Validation)_简版

    解决的主要问题是过拟合(Over fitting),用于模型调参和模型选择,确定测试集用于验证的模型。 决不能使用测试集(X_test)来进行参数和模型调优,避免使用未来信息...

  • 数据预处理小结_简版

    一、数据清洗 在讨论具体的方法前,想讨论一个大前提,数据的预处理是否是测试集和训练集一起进行?答案是不要。 简单而言,就是不应当把测试的信息引入训练中。但在确定预处理方法后,...

  • 120
    逻辑回归的基本原理&深度学习_简版

    温故而知新,可以为师也。 至于为什么要加入深度学习的对比,是想通过前沿算法的对比,体现出LR的优势与特点,以及深度学习可以期待的用途。 一、逻辑回归的基本原理 基本概念 od...

  • 特征工程与自动化_简版

    一、基本方法论 近似特征的差:适用于聚类、异常值检测等。电商领域常用的两个几乎相等的特征原始订单价和净订单价,相关系数0.9,对大多数用户而言,这两个值是相等的。不等的一小部...

  • 过拟合与正则化小结_简版

    一、过拟合 模型复杂度太高的表现,模型的泛化能力十分重要,交叉验证是识别过拟合的好方法。 1、主要原因 数据有噪声,无法避免,会影响训练集的数据分布。 训练数据有限,样本无法...

  • 120
    模型的价值与适用性

    想起一位招聘的猎头说过,数据人员一年几十万,有时公司是会觉得没什么用,特别是非核心业务线。这几年自己有一些体会,分享一下,欢迎探讨。 首先很多业务问题并不能转化为数据问题,或...

  • 评分卡建模流程

    一、样本与目标变量的定义 A卡样本的确定: 同时考虑实际业务特性,如最好至少覆盖12个月(季节波动),模型的稳定性非常重要。假如模型(数据分析)的性能对样本时间窗口高度敏感,...

  • 120
    风险管理小结_简版

    一、政策风险 房地产三条红线,恒大债券违约、教培行业的政策打压、贸易战的影响等。 二、风险控制流程 KYC(个人信息验证)--> 信用风险评估(还款能力、还款意愿_历史信用表...

  • PCA&SVD的基本原理

    一、基本原理 降维,PCA更多的发现特征间的线性关系,t-SNE主打非线性降维。 Dimensionality reduction we normally use it to...

  • 面试准备_沟通技巧

    主要目标:不着痕迹的表达出自己的优点,真诚、务实的回答问题、面对缺点,不卑不亢。 仪表干净得体,谈吐清楚自信(充分表达),说话慢一点,不要有小动作。 选择是双向的,合理的争取...

  • 诗词赏析

    闲来无事,历史的词句整理如下,共赏。 天空一无所有,为何给我安慰。(海子) 十分冷淡存知己,一曲微茫度此生。(张允和) 江南无所有,聊赠一枝春。(陆凯) 不求自真外求佛,寻觅...

  • Pythonic&性能优化

    一、最简单的方式 使用python原生库和第三方包,不要自己造轮子,浪费时间,执行效率大概率低。 工作中常用到的枚举如下(np和pd就不提了):队列、排序:deque(双向对...

  • 临江仙·送钱穆父 苏轼

    临江仙·送钱穆父 苏轼 一别都门三改火,天涯踏尽红尘。依然一笑作春温。无波真古井,有节是秋筠。 惆怅孤帆连夜发,送行淡月微云。尊前不用翠眉颦。人生如逆旅,我亦是行人。

  • 家庭常用医疗用品

    一、药品 感冒疏风胶囊:疫情购买,据说很管用,保质期3年。 抗过敏药(抗组胺药物):氯雷他定,无活性,经肝脏代谢后,生成地氯雷他定,适用于2岁以上的儿童,根据不同的年龄选择合...

  • 钓台题壁 - 郁达夫

    钓台题壁 郁达夫, 1931年 不是樽前爱惜身,佯狂难免假成真。 曾因酒醉鞭名马,生怕情多累美人。 劫数东南天作孽,鸡鸣风雨海扬尘。 悲歌痛哭终何补,义士纷纷说帝秦。

  • 120
    Python小结_Pythonic

    零散整理,可能内容多是pythonic方面的,毕竟每有新知,都很开心。 一、列表推导与lambda函数 之所以把他两放在第一部分,原因有二:比较能体现出python语言的特性...

  • 特征选择小结_简版

    前团队的博士同学研究特征选择,受他影响,有所关注,总结如下。 一、评分卡传统方法 IV排序、PSI稳定性。 二、sklearn框架 略。 三、其他算法 Boruta 特征选择...

  • Python常用工具函数_简版

    时间关系,没有花太多精力在工具函数的开发上,业务才是王道,工具函数最好用现成的,没有的话交给IT运维人员更为合适,已有的整理如下。 字符类型检测 importchardets...

  • Python小结_代码测试

    断言 断言是作为一种调试工具被发明出来的,用来检查那些“代码写对了就肯定成立”的条件,可用if + raise语句实现同样的效果。 与异常的应用场景差异:检查先验条件使用断言...