当前位置: 首页 > article >正文

Python 逻辑回归

  • 逻辑回归分类 

训练二元分类器

  • 加载仅有两个分类的数据
from sklearn.linear_model import LogisticRegression
from sklearn import datasets
from sklearn.preprocessing import StandardScaleriris = datasets.load_iris()
features = iris.data[:100,:]
target = iris.target[:100]
  • 特征标准化
scaler = StandardScaler()
features_standardized = scaler.fit_transform(features)
  • 训练模型
logistic_regression = LogisticRegression(random_state=0)
model = logistic_regression.fit(features_standardized,target)
  • 逻辑回归是一种二元分类器。只能处理二元的分类
  • 创建观察值并确定分类
>>> new_observation = [[0.5,0.5,0.5,0.5]]
>>> model.predict(new_observation)
array([1])
  • 查看分类的概率
model.predict_proba(new_observation)
array([[0.17738424, 0.82261576]])

训练多元分类器

  • 加载数据和包
from sklearn.linear_model import LogisticRegression
from sklearn import datasets
from sklearn.preprocessing import StandardScaleriris = datasets.load_iris()
features = iris.data
target = iris.target
  • 标准化特征
scaler = StandardScaler()
features_standardized = scaler.fit_transform(features)
  • 创建回归对象并训练模型
logistic_regression = LogisticRegression(random_state=0,multi_class="ovr")
model = logistic_regression.fit(features_standardized,target)
  • 创建观察值并分类
>>> new_observations = [[0.7,0.7,0.7,0.7]]
>>> model.predict(new_observations)
array([2])
>>> model.predict_proba(new_observations)
array([[0.0141224 , 0.22656313, 0.75931447]])

通过正则化来减小方差

  • 正则化是通过城发复杂模型来减小方差的方法
  • 将一个惩罚项加在我们希望最小化的损失函数上
  • LogisticRegressionCV的参数
    • penalty:惩罚形式
      • L1惩罚
      • L2惩罚
    • CS
      • 可以接受两类值
        • 浮点数列表
          • 用于标志搜索正则化强度的范围
        • 整型数据
          • 其他

利用随机平均梯度训练(sag)逻辑回归模型

  • 随机平均梯度算法使我们在超大数据集上训练分类比用其他模型的速度要快一些
  • 大部分情况下,scikit-learn会帮助我们自动选择最佳的solver 或者 给出一些警告
logistic_regression = LogisticRegression(random_state=0,solver="sag")

处理不均衡的分类

  • LogisticRegression 自带一个处理不均衡的分类方法
  • 人工处理不均衡的分类
LogisticRegression(random_state=0,class_weight="balanced")

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.dgrt.cn/a/58365.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章:

Python 逻辑回归

逻辑回归分类 训练二元分类器 加载仅有两个分类的数据 from sklearn.linear_model import LogisticRegression from sklearn import datasets from sklearn.preprocessing import StandardScaleriris datasets.load_iris() features iris.data[:100,:] target iris.target…...

web前端面试题附答案016-怎么让顶部轮播图渲染的更快?

一、为什么强调轮播图? 很多时候我们强调用户体验,而这里更多时候我们更强调完美的首屏体验,而现在几乎每个网站顶部第一个大模块就是轮播图。轮播图占得区域最大,图片质量也更高,几乎一张图片的面积,体积就…...

Python脚本,物联网云服务器端口监控

事实上,物联网的思路很简单,客户端设备通过TCP协议上传到某个云服务器的端口,我们需要在这个云服务器上编写一个小小的脚本去创建某个端口,持续监听,可以互相发送数据,这个脚本语言可以是JAVA,也…...

Python之wxPython框架的使用

Python之wxPython框架的使用一、安装wxPython二、创建一个 wx.App 的子类三、直接使用wx.App四、使用wx.Frame 框架五、常用控件1.Static Text 文本类2.TextCtrl 输入文本类3.Button 按钮类一、安装wxPython wxPython是个成熟而且特性丰富的跨平台GUI工具包。由Robin Dunn 和Ha…...

量子密钥分发B92协议——笔记

一、B92介绍 (参照邓富国的博士论文) 1、什么是量子密钥分配(QKD) 通信双方以量子态为信息载体,利用量子力学原理,通过量子信道传送,在彼此之间建立共享密钥的方法。 2、B92协议简介&#x…...

TiFlash 数据校验

本文档介绍 TiFlash 的数据校验机制以及相关的工具。 使用场景 数据损坏通常意味着严重的硬件故障。在这种情形下,即使尝试自主修复,也会使得数据的可靠性下降。TiFlash 默认对数据文件进行基础的校验,使用固定的 City128 算法。一旦发现数…...

JavaWeb实战002-servlet原理

request 和 response 过程 request browser 使用 request 请求 tomcat,tomcat 根据 servlet 请求 webapp response webapp 返回给 tomcat,tomcat 再 response 给 browser 简单模拟 servlet 以下所有文件都在同一个目录下,目录结构&#xff…...

基于深度学习的命名实体识别研究综述——论文研读

基于深度学习的命名实体识别研究综述摘要:0引言1基于深度学习的命名实体识别方法1.1基于卷积神经网络的命名实体识别方法1.2基于循环神经网络的命名实体识别方法1.3基于Transformer的命名实体识别方法1.4其他的命名实体识别方法1.5基于深度学习的命名实体识别方法对…...

2022下半年数学建模竞赛汇总(比赛时间、出成绩时间)

1、2022年天府杯全国大学生数学建模国际赛 竞赛开始时间:2022年10月20日18:00 预计出成绩时间:2022年11月5日 是否可跨校:是 2、2022年中国高校大数据挑战赛 竞赛开始时间:2022年10月27日8:00 预计出…...

为什么python证券接口通达信系统中没有接口?

Python证券接口通达信是一种动态类型语言,拥有ducking type的特征,因此是天生支持接口。python有个自动保存到etcd的库,可以网上搜下看下这个库的使用以及它开发的api接口,不过之前go使用etcd的时候,是调用etcd本身的r…...

2022年河南省高等职业教育技能大赛移动应用开发赛项竞赛方案

2022年河南省高等职业教育技能大赛 移动应用开发赛项竞赛方案 一、赛项名称 赛项名称:移动应用开发 赛项组别:高职组 赛项归属专业大类:电子信息大类 主办单位:河南省教育厅 承办院校:信阳职业技术学院 报到及住…...

【vue3】使用vite构建vue3项目

>😉博主:初映CY的前说(前端领域) ,📒本文核心:使用vite构建vue3项目 【前言】 当我们选择了vue3作为我们项目的开发,就更加的推荐使用vite来对我们的项目进行打包。很简单——这也是开发vue的团队开发的工具&#x…...

SpringBoot+Netty实现TCP客户端实现接收数据按照16进制解析并存储到Mysql以及Netty断线重连检测与自动重连

场景 在SpringBoot项目中需要对接三方系统,对接协议是TCP,需实现一个TCP客户端接收 服务端发送的数据并按照16进制进行解析数据,然后对数据进行过滤,将指定类型的数据 通过mybatis存储进mysql数据库中。并且当tcp服务端断连时&…...

吉林省互联网医院资质申请条件|牌照申请

吉林省互联网医院资质申请条件|牌照申请|长春市|四平市|辽源市|通化市|白山市|松原市|白城市|延边朝鲜族自治州 吉林省互联网医院资质申请条件   一、《医疗机构管理条例》第十六条申请医疗机构执业登记,应具备下列条件:   1.有设置医疗机构批准书&a…...

解决linux如何安装BBRplus,以及安装BBRplus版加速失败的问题

解决linux安装BBRplus版加速失败的问题安装BBRplus的支持环境解决的问题安装BBRplus解决方法总结安装BBRplus的支持环境 Centos 7, Debian 8/9, Ubuntu 16/18 测试通过, 不支持 OVZ。 本文的操作环境是Ubuntu 20.04。 如果不知道自己的系统,使用命令 lsb_release…...

【目标检测】---- 正负样本匹配策略

1 综述 无论是anchor box 还是anchor free,在训练计算类别/前背景损失时都需用到正负样本匹配,目前分为两大类: 第一类 fixed label assignment,常用的主要有MaxIou、ATSS、focos 第二类 dyanmic label assignment,常…...

类初始化过程与对象创建过程

如果有兴趣了解更多相关内容,欢迎来我的个人网站看看:耶瞳空间 面试经常遇见,所以记录一下。 类初始化过程 Java类的初始化过程可以分为以下几个步骤: 加载:当Java程序要使用某个类时,系统会先检查该类…...

cdr怎么保存低版本 cdr保存低版本闪退

cdr是一款拥有着强大用户群体的矢量图编辑软件,它从面世至今经历了多个版本的迭代,不同版本各具特色,有时候我们需要将cdr保存为低版本,但在操作时可能会遇到一些问题,比如闪退等等,下面我们一起来了解一下…...

数据库,容器化如虎添翼

最近看到一篇推文,痛述MySQL不能上容器的各种理由,基本是N年前的陈词滥调,东拼西凑出的一篇水帖,文末对于数据库是否能上容器,也是模糊不清,没有确切的观点,标题倒是吸引眼球,不明就…...

【CE】Mac下的CE教程Tutorial:基础篇(第5关:代码查找器)

▒ 目录 ▒🛫 导读开发环境1️⃣ 第五关:代码查找器翻译操作步骤🛬 文章小结📖 参考资料🛫 导读 开发环境 版本号描述文章日期2023-03-操作系统MacOS Big Sur 11.5Cheat Engine7.4.3 1️⃣ 第五关:代码查…...