文章目录:
一、信贷风控中的名单库挖掘、使用和维护
信贷风控中的名单库挖掘、使用和维护名单库在信贷风控的反欺诈和建模中,是一种可解释性强 、有效且精准的手段 。以下从名单库的挖掘、使用和维护三个方面进行详细阐述。
一、名单库的挖掘
1. 可用数据源- 通讯录:网贷平台常要求用户授权导入手机本地通讯录 ,其中的备注信息可作为有效数据源。例如,用户可能会给联系人打上“房产中介_小陈”“保洁_王阿姨 ”等标签。通过简单的SQL正则匹配统计,就能得到号码的标签 。
- 短信:短信内容也能用于正则匹配获取短信号码的标签。
- 微信昵称:与通讯录不同,这是用户主动打标签的方式。在微信搜索好友时 ,输入手机号码可找到相应注册用户 。一些中介为推销业务,常在昵称中注明相关信息,如“网贷包过_小王” ,信息核验时可据此查询。
- 论坛文本:可根据用户注册手机号码和发言内容进行推测,但存在口语化严重 、表情符号多、上下文语义弱等问题,文本处理难度较高 ,且大部分公司可能缺少这类数据。
- 百度数据:能对数据起到一定程度的补充作用,但返回的长文本增加了处理难度 。
2. 号码打标签
- 短文本正则匹配:这是最有效但较累的方法 ,需要调研案例得到各类词库。例如逾期词库的正则表达式:text rlike '.*(已逾期|已经逾期|发生逾期|逾期金额|逾期应还|拖欠我司|拖欠款项|严重逾期|逾期欠款|逾期未还金额|已经出现逾期|已违约|多次提醒仍未还款).*' 。
- 用户标签逆推:号码背后的属性本质是人的属性,可利用App等其他数据构建用户画像。比如定义安装借贷类App较多的用户为多头借贷严重用户,然后给用户所注册手机号打上相同标签。目前这两种方案能满足80%的场景 。
二、名单库的使用
1. 反欺诈策略在反欺诈规则中应用直接 ,可根据申贷用户号码是否在(黑)名单库中予以拦截。若做成单变量规则(如最近与号码库中号码通话次数),需制定cutoff,评估圈中人群的贷后逾期表现lift是否足够高(一般在3以上即可),以及拦截率是否相对稳定(按月对历史样本评估订单通过率和bad rate是否稳定)。2. 风控建模特征工程常见做法是将号码库应用在通讯录 、运营商通话记录数据特征工程中 ,构造RFM类特征变量。例如:
- contact_agent_ratio:通讯录中命中中介号码的个数占比 。
- carrier_agent_call_time_l7d:userid与所有中介在订单申请时间前7天总通话时长合计。
三、名单库的维护
1. 离线名单库在为迭代风控模型做特征需要而搜集各类号码库时,会发现很多号码库没有时间快照,这会导致信息泄漏问题。在风控建模中 ,需把特征X(限定在下单前的历史信息,避免信息泄漏)和Y(未来逾期表现)关联到历史订单上得到样本 。若直接把全量号码库关联到历史订单上,而不考虑挖掘号码库所依赖的数据采集时间是否在订单时间之后 ,就会出现信息泄漏。上线后模型KS会快速下降。正确的做法是名单库以分区表存储,分区为dt,存放截止到dt的快照数据 。例如 ,用2019 - 08 - 01之前的历史全量通讯录备注数据打标得到一个号码库,就存在2019 - 08 - 01这个分区。2019 - 08 - 01的订单可以使用此号码库,但2019 - 07 - 31的订单不能使用 ,因为用到了相对于订单的未来信息。这样既能保证号码库不断扩充(每个分区存放全量号码库),又能用于风控建模的特征工程 。
设计离线名单库时,一般包含的字段有:phone(号码)、tag1(父标签) 、tag2(子标签)、data_source(挖掘所依赖的数据源)、dt(分区,全量更新)。
目前业务方(反欺诈)需求通常只要求召回足够多的号码入库 ,技术同学会用历史全量数据离线挖掘一批,交给业务同学验收,业务同学抽样人工核验后入库。但业务同学局限于自身业务场景 ,未考虑到其他价值,建议业务同学提需求时尽可能考虑其他价值 。
2. 在线名单库为保证线上规则稳定,上线时一般用截止某个时间节点的名单库做规则。实践中 ,每次名单库更新,为配合策略规则调整,需要更新线上名单库。由于缺乏线上名单库管理系统 ,技术同学常将名单列表写死在代码中,每次更新需更新代码再发布。
为提高策略迭代效率,保证风控私密性 ,建议开发名单库管理系统,并与实时变量计算平台集成 。这样业务策略同学可自助完成维护名单库和SQL变量开发,技术同学主要负责底层相关数据导入实时变量计算平台和计算支持,实现两者解耦。
二 、购买股票流程
购买股票的流程。
1、到同证券公司营业部有银证转账业务的银行办一张银行卡(可以是0存款) ,本人带身份证,银行卡,在股市交易时间,到证券营业厅开股东帐户(股东卡登记费一般90元,也有的营业部免费),营业部给您一个客户号(一般利用客户号登录交易系统).
股票的交易时间是每周一至周五(节假日休市)9:30-11:30、13:00-15:00.集合竞价的时间是9:15-9:25 ,其中9:20-9:25是不可撤单的时间 。
2、办理网上交易手续;
3 、开通银证转账业务(含第三方托管).
以上3条都必须是本人(带身份证)亲自办理,代办不行
4、下载所属证券公司的交易软件(带行情分析软件)在电脑安装使用.
一般用客户号登陆网上交易系统,进入系统后 ,通过银证转账将银行的钱转到证券公司就可以买股票了。
开户的当天就可以买深圳的股票,第二个交易日可以买上海的股票。当天买的股票只能第二个交易日卖出,卖出股票的钱 ,当天可以买股票,第二个交易日才可以转到银行,转到银行后 ,马上就能取用 。
不同的营业部的佣金比例不同,极个别的营业部还要每笔收1-5元委托(通讯)费。
交易佣金一般是买卖股票金额的0.1%-0.3%(网上交易少,营业部交易高,可以讲价 ,一般网上交易0.18%,电话委托0.25%,营业部自助委托0.3%。),每笔最低佣金5元 ,印花税是卖出股票金额的0.1%(基金,权证免税),上海每千股股票要1元过户手续费(基金、权证免过户费),不足千股按千股算 。
由于每笔最低佣金5元 ,所以每次交易为5÷佣金比率 、约为(1666-5000)元比较合算.
如果没有每笔委托费,也不考虑最低佣金和过户费,佣金按0.3% ,印花税0.1%(单边)算,买进股票后,上涨0.71%以上卖出 ,可以获利。
买进以100股(一手)为交易单位,卖出没有限制(股数大于100股时,可以1股1股卖,低于100股时 ,只能一次性卖出。),但应注意最低佣金(5元)和过户费(上海、最低1元)的规定.
您可以在第二天,网上交易的“历史成交”或“交割单”栏目里,看到手续费的具体明细 。
关于炒股的方法,理念,网上搜索很多就不一一列举了,祝您成功!

来源百度侵权删除


