风险就是损失的可能性,风险经营就是平衡损失的可能性和收益期望,风险策略是具体的抓手。 一、策略体系的构建 目标:满足实际的业务需求。 策略架构搭建 熟悉产品类型,了解进件流程...
风险就是损失的可能性,风险经营就是平衡损失的可能性和收益期望,风险策略是具体的抓手。 一、策略体系的构建 目标:满足实际的业务需求。 策略架构搭建 熟悉产品类型,了解进件流程...
解决的主要问题是过拟合(Over fitting),用于模型调参和模型选择,确定测试集用于验证的模型。 决不能使用测试集(X_test)来进行参数和模型调优,避免使用未来信息...
一、数据清洗 在讨论具体的方法前,想讨论一个大前提,数据的预处理是否是测试集和训练集一起进行?答案是不要。 简单而言,就是不应当把测试的信息引入训练中。但在确定预处理方法后,...
温故而知新,可以为师也。 至于为什么要加入深度学习的对比,是想通过前沿算法的对比,体现出LR的优势与特点,以及深度学习可以期待的用途。 一、逻辑回归的基本原理 基本概念 od...
一、基本方法论 近似特征的差:适用于聚类、异常值检测等。电商领域常用的两个几乎相等的特征原始订单价和净订单价,相关系数0.9,对大多数用户而言,这两个值是相等的。不等的一小部...
一、过拟合 模型复杂度太高的表现,模型的泛化能力十分重要,交叉验证是识别过拟合的好方法。 1、主要原因 数据有噪声,无法避免,会影响训练集的数据分布。 训练数据有限,样本无法...
想起一位招聘的猎头说过,数据人员一年几十万,有时公司是会觉得没什么用,特别是非核心业务线。这几年自己有一些体会,分享一下,欢迎探讨。 首先很多业务问题并不能转化为数据问题,或...
一、样本与目标变量的定义 A卡样本的确定: 同时考虑实际业务特性,如最好至少覆盖12个月(季节波动),模型的稳定性非常重要。假如模型(数据分析)的性能对样本时间窗口高度敏感,...
一、政策风险 房地产三条红线,恒大债券违约、教培行业的政策打压、贸易战的影响等。 二、风险控制流程 KYC(个人信息验证)--> 信用风险评估(还款能力、还款意愿_历史信用表...
一、基本原理 降维,PCA更多的发现特征间的线性关系,t-SNE主打非线性降维。 Dimensionality reduction we normally use it to...
主要目标:不着痕迹的表达出自己的优点,真诚、务实的回答问题、面对缺点,不卑不亢。 仪表干净得体,谈吐清楚自信(充分表达),说话慢一点,不要有小动作。 选择是双向的,合理的争取...
闲来无事,历史的词句整理如下,共赏。 天空一无所有,为何给我安慰。(海子) 十分冷淡存知己,一曲微茫度此生。(张允和) 江南无所有,聊赠一枝春。(陆凯) 不求自真外求佛,寻觅...
一、最简单的方式 使用python原生库和第三方包,不要自己造轮子,浪费时间,执行效率大概率低。 工作中常用到的枚举如下(np和pd就不提了):队列、排序:deque(双向对...
临江仙·送钱穆父 苏轼 一别都门三改火,天涯踏尽红尘。依然一笑作春温。无波真古井,有节是秋筠。 惆怅孤帆连夜发,送行淡月微云。尊前不用翠眉颦。人生如逆旅,我亦是行人。
一、药品 感冒疏风胶囊:疫情购买,据说很管用,保质期3年。 抗过敏药(抗组胺药物):氯雷他定,无活性,经肝脏代谢后,生成地氯雷他定,适用于2岁以上的儿童,根据不同的年龄选择合...
钓台题壁 郁达夫, 1931年 不是樽前爱惜身,佯狂难免假成真。 曾因酒醉鞭名马,生怕情多累美人。 劫数东南天作孽,鸡鸣风雨海扬尘。 悲歌痛哭终何补,义士纷纷说帝秦。
零散整理,可能内容多是pythonic方面的,毕竟每有新知,都很开心。 一、列表推导与lambda函数 之所以把他两放在第一部分,原因有二:比较能体现出python语言的特性...
前团队的博士同学研究特征选择,受他影响,有所关注,总结如下。 一、评分卡传统方法 IV排序、PSI稳定性。 二、sklearn框架 略。 三、其他算法 Boruta 特征选择...
时间关系,没有花太多精力在工具函数的开发上,业务才是王道,工具函数最好用现成的,没有的话交给IT运维人员更为合适,已有的整理如下。 字符类型检测 importchardets...
断言 断言是作为一种调试工具被发明出来的,用来检查那些“代码写对了就肯定成立”的条件,可用if + raise语句实现同样的效果。 与异常的应用场景差异:检查先验条件使用断言...