Some Rank/Multi-task model implemented by Pytorch

These details have not been verified by PyPI

Project links

Homepage

GitHub Statistics

View statistics for this project via Libraries.io, or by using our public dataset on Google BigQuery

Project description

Rec PanGu

1.开源定位

使用pytorch对经典的rank/多任务模型进行实现，并且对外提供统一调用的API接口，极大的降低了使用Rank/多任务模型的时间成本
该项目使用了pytorch来实现我们的各种模型，以便于初学推荐系统的人可以更好的理解算法的核心思想
由于已经有了很多类似的优秀的开源，我们这里对那些十分通用的模块参考了已有的开源，十分感谢这些开源贡献者的贡献

2.安装

这里把项目已经提交到pypi上面了，可以通过pip进行快速安装

#最新版
1. git clone https://github.com/HaSai666/rec_pangu.git
2. cd rec_pangu
3. pip install -e . --verbose

#稳定版 
pip install rec_pangu --upgrade

3.Rank模型

这里目前支持以下Rank模型

模型	论文	年份	相关资料
WDL	Wide & Deep Learning for Recommender Systems	2016	TBD
DeepFM	DeepFM: A Factorization-Machine based Neural Network for CTR Prediction	2017	TBD
NFM	Neural Factorization Machines for Sparse Predictive Analytics	2017	TBD
FiBiNet	FiBiNET: Combining Feature Importance and Bilinear Feature Interaction for Click-Through Rate	2019	TBD
AFM	Attentional Factorization Machines	2017	TBD
AutoInt	AutoInt: Automatic Feature Interaction Learning via Self-Attentive Neural Networks	2018	TBD
CCPM	A Convolutional Click Prediction Model	2015	TBD
LR	/	2019	TBD
FM	/	2019	TBD
xDeepFM	xDeepFM: Combining Explicit and Implicit Feature Interactions for Recommender Systems	2018	TBD
DCN	Deep & Cross Network for Ad Click Predictions	2019	TBD

4.多任务模型

目前支持以下多任务模型

模型	论文	年份	相关资料
MMOE	Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts	2018	TBD
ShareBottom	Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts	2018	TBD
ESSM	Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate	2018	TBD
OMOE	Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts	2018	TBD
MLMMOE	/	/	TBD
AITM	Modeling the Sequential Dependence among Audience Multi-step Conversions with Multi-task Learning in Targeted Display Advertising	2019	TBD

5.Demo

我们的Rank和多任务模型所对外暴露的接口十分相似，我们下面会分别给出Rank和多任务模型的demo

5.1 Rank Demo

#声明数据schema
import torch
from rec_pangu.dataset import get_dataloader
from rec_pangu.models.ranking import WDL, DeepFM, NFM, FiBiNet, AFM, AFN, AOANet, AutoInt, CCPM, LR, FM, xDeepFM
from rec_pangu.trainer import RankTraniner
import pandas as pd

if __name__=='__main__':
    df = pd.read_csv('sample_data/ranking_sample_data.csv')
    print(df.head())
    #声明数据schema
    schema={
        "sparse_cols":['user_id','item_id','item_type','dayofweek','is_workday','city','county',
                      'town','village','lbs_city','lbs_district','hardware_platform','hardware_ischarging',
                      'os_type','network_type','position'],
        "dense_cols" : ['item_expo_1d','item_expo_7d','item_expo_14d','item_expo_30d','item_clk_1d',
                       'item_clk_7d','item_clk_14d','item_clk_30d','use_duration'],
        "label_col":'click',
    }
    #准备数据,这里只选择了100条数据,所以没有切分数据集
    train_df = df
    valid_df = df
    test_df = df

    #声明使用的device
    device = torch.device('cpu')
    #获取dataloader
    train_loader, valid_loader, test_loader, enc_dict = get_dataloader(train_df, valid_df, test_df, schema)
    #声明模型,排序模型目前支持：WDL, DeepFM, NFM, FiBiNet, AFM, AFN, AOANet, AutoInt, CCPM, LR, FM, xDeepFM
    model = xDeepFM(enc_dict=enc_dict)
    #声明Trainer
    trainer = RankTraniner(num_task=1)
    #训练模型
    trainer.fit(model, train_loader, valid_loader, epoch=5, lr=1e-3, device=device)
    #保存模型权重
    trainer.save_model(model, './model_ckpt')
    #模型验证
    test_metric = trainer.evaluate_model(model, test_loader, device=device)
    print('Test metric:{}'.format(test_metric))

5.2 多任务模型Demo

import torch
from rec_pangu.dataset import get_dataloader
from rec_pangu.models.multi_task import AITM,ShareBottom,ESSM,MMOE,OMOE,MLMMOE
from rec_pangu.trainer import RankTraniner
import pandas as pd

if __name__=='__main__':
    df = pd.read_csv('sample_data/multi_task_sample_data.csv')
    print(df.head())
    #声明数据schema
    schema={
        "sparse_cols":['user_id','item_id','item_type','dayofweek','is_workday','city','county',
                      'town','village','lbs_city','lbs_district','hardware_platform','hardware_ischarging',
                      'os_type','network_type','position'],
        "dense_cols" : ['item_expo_1d','item_expo_7d','item_expo_14d','item_expo_30d','item_clk_1d',
                       'item_clk_7d','item_clk_14d','item_clk_30d','use_duration'],
        "label_col":['click','scroll'],
    }
    #准备数据,这里只选择了100条数据,所以没有切分数据集
    train_df = df
    valid_df = df
    test_df = df

    #声明使用的device
    device = torch.device('cpu')
    #获取dataloader
    train_loader, valid_loader, test_loader, enc_dict = get_dataloader(train_df, valid_df, test_df, schema)
    #声明模型,多任务模型目前支持：AITM,ShareBottom,ESSM,MMOE,OMOE,MLMMOE
    model = AITM(enc_dict=enc_dict)
    #声明Trainer
    trainer = RankTraniner(num_task=2)
    #训练模型
    trainer.fit(model, train_loader, valid_loader, epoch=5, lr=1e-3, device=device)
    #保存模型权重
    trainer.save_model(model, './model_ckpt')
    #模型验证
    test_metric = trainer.evaluate_model(model, test_loader, device=device)
    print('Test metric:{}'.format(test_metric))

Project details

These details have not been verified by PyPI

Project links

Homepage

GitHub Statistics

View statistics for this project via Libraries.io, or by using our public dataset on Google BigQuery

Release history Release notifications | RSS feed

0.4.1

Jul 26, 2023

0.4.0

Jul 16, 2023

0.3.9

Jul 11, 2023

0.3.7

Apr 11, 2023

0.3.6

Apr 11, 2023

0.3.5

Apr 11, 2023

0.3.4

Mar 23, 2023

0.3.3

Mar 23, 2023

0.3.2

Mar 23, 2023

0.3.1

Mar 23, 2023

0.3.0

Mar 14, 2023

0.2.9

Mar 6, 2023

0.2.8

Nov 16, 2022

0.2.7

Nov 15, 2022

0.2.6

Nov 15, 2022

0.2.5

Nov 11, 2022

0.2.4

Oct 19, 2022

0.2.3

Oct 19, 2022

0.2.2

Sep 19, 2022

0.2.1

Sep 19, 2022

0.2.0

Sep 19, 2022

0.1.9

Sep 19, 2022

0.1.8

Sep 19, 2022

0.1.7

Sep 19, 2022

0.1.6

Sep 19, 2022

0.1.5

Sep 19, 2022

0.1.4

Sep 19, 2022

0.1.3

Aug 21, 2022

0.1.2

Aug 18, 2022

0.1.1

Aug 18, 2022

0.1.0

Aug 18, 2022

0.0.8

Jun 16, 2022

This version

0.0.7

Jun 15, 2022

0.0.6

Jun 15, 2022

0.0.5

Jun 14, 2022

0.0.4

Jun 14, 2022

0.0.3

Jun 10, 2022

0.0.2

Jun 10, 2022

0.0.1

Jun 10, 2022

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

rec_pangu-0.0.7.tar.gz (23.4 kB view hashes)

Uploaded Jun 15, 2022 Source

Built Distribution

rec_pangu-0.0.7-py2.py3-none-any.whl (43.8 kB view hashes)

Uploaded Jun 15, 2022 Python 2 Python 3

Hashes for rec_pangu-0.0.7.tar.gz

Hashes for rec_pangu-0.0.7.tar.gz
Algorithm	Hash digest
SHA256	`2c65852aacf1d668bfb8dd175c60e67062da2d7bb41f93052b1e103b2336ca68`
MD5	`411b8f11b0877857b1bd13c548856476`
BLAKE2b-256	`39e44cd5bdb453d9fec21d25cef4e252e0977d05f1b2654b8dce0deb13e440ba`

Hashes for rec_pangu-0.0.7-py2.py3-none-any.whl

Hashes for rec_pangu-0.0.7-py2.py3-none-any.whl
Algorithm	Hash digest
SHA256	`33adce58b6f7bc80231b89b7d5f30f122bab0487b7f9b441980cbc3eaa66c870`
MD5	`249bc909ede042b312c2a61f1d4603ab`
BLAKE2b-256	`18ecf41a7c35a7c5c332ab99c22c4cc03554baa9005d3366f41d12f98a5c674e`