soword科技言
永久公益免费API接口
提供永久免费的API接口,查看更多API接口,如果您有其他免费API资源,请联系我们,造福人类。
提供商务开发:小程序,系统,APP
定制开发,免费评估,免费咨询,价格便宜,售后保障,前往开发服务中心联系开发客服中心
LabelEncoder适用于Pandas df的顺序

在熊猫df的列上安装了scikit-learn LabelEncoder

如何确定将遇到的字符串映射到整数的顺序?它是确定性的吗?

更重要的是,我可以指定此顺序吗?

import pandas as pdfrom sklearn import preprocessingdf = pd.DataFrame(data=["first", "second", "third", "fourth"], columns=['x'])le = preprocessing.LabelEncoder()le.fit(df['x'])print list(le.classes_)### this prints ['first', 'fourth', 'second', 'third']encoded = le.transform(["first", "second", "third", "fourth"]) print encoded### this prints [0 2 3 1]

我希望le.classes_["first", "second", "third", "fourth"],然后encoded[0 1 2 3],因为这是字符串在列中出现的顺序。能做到吗?

我想为我的一个应用程序指定LabelEncoder的顺序。由于我不想迁移一些代码并使用其他一些库。我设法实现了暂时的解决方法。

因为一开始我就知道数据集中的类别,所以我创建了虚拟类别,这些虚拟类别将按字母顺序排列为所需的特定顺序。

{0:ARejected,1:ZApproved}

之后,我将标签编码器安装到数据集上。装好后,我将替换标签编码器的类,以确保将来可以按需要映射标签。



2023-03-22 10:04:21

新人小程序+APP定制199元起


发放福利,助力中小企业发展,真正在互联网中受益

点击询问定制

广告服务展示