进步数据科学服从的 8 个Python神库!

藏宝库编辑 2024-10-11 14:38:56 3692 0 来自 中国
在举行数据科学时,可能会浪费大量时间编码并期待计算机运行某些东西。以是我选择了一些 Python 库,可以资助你节流宝贵的时间。
1、Optuna
Optuna 是一个开源的超参数优化框架,它可以自动为呆板学习模子找到最佳超参数。
2、ITMO_FS
ITMO_FS 是一个特性选择库,它可以为 ML 模子举行特性选择。拥有的观察值越少,就越必要审慎处理过多的特性,以制止太过拟合。所谓“审慎”意思是应该规范你的模子。通常一个更简单的模子(更少的特性),更容易明白和表明。
3、shap-hypetune
到目前为止,我们已经看到了用于特性选择和超参数调解的库,但为什么不能同时使用两者呢?这就是 shap-hypetune 的作用。
4、PyCaret
PyCaret 是一个开源、低代码的呆板学习库,可自动实验呆板学习工作流。它涵盖探索性数据分析、预处理、建模(包罗可表明性)和 MLOps。
5、FloWeaver
FloWeaver 可以从流数据集中天生桑基图。
6、Gradio

如果你阅读过敏捷数据科学,就会知道拥有一个让终极用户从项目开始就与数据举行交互的前端界面是多么有资助。
7、Terality
明白 Terality 的最佳方式是将其视为“Pandas ,但速率更快”。这并不意味着完全更换 pandas 而且必须重新学习如何使用df:Terality 与 Pandas 具有完全相同的语法。实际上,他们乃至发起“import Terality as pd”,并继续按照从前的风俗的方式举行编码。
8、Torch-Handle
如果你是Pytorch的使用者,可以试试这个库。
Torchhandle是一个PyTorch的辅助框架。它将PyTorch繁琐和重复的练习代码抽象出来,使得数据科学家们可以或许将精力放在数据处理、创建模子和参数优化,而不是编写重复的练习循环代码。使用torchhandle,可以让你的代码更加轻便易读,让你的开发任务更加高效。
您需要登录后才可以回帖 登录 | 立即注册

Powered by CangBaoKu v1.0 小黑屋藏宝库It社区( 冀ICP备14008649号 )

GMT+8, 2024-11-21 18:20, Processed in 0.168207 second(s), 32 queries.© 2003-2025 cbk Team.

快速回复 返回顶部 返回列表