Using groupby and cumsum to get a new column in pandas

Question

Using groupby and cumsum to get a new column in pandas

58 Views Asked by Doyino Delima At 24 September 2023 at 21:40

I have the following dataframe:

Class	Received	Issued
FD	10	0
FD	0	2
RM	5	0
RM	0	3
FD	0	2
PM	5	0
PM	1	0
RM	1	0
FD	4	0

I require the dataframe below:

Class	Received	Issued	Remaining Quantity
FD	10	0	10
FD	0	2	8
RM	5	0	5
RM	0	3	2
FD	0	2	6
PM	5	0	5
PM	1	0	6
RM	1	0	3
FD	4	0	10

The remaining quantity column is cumsum() of received - issued per class. I have tried different methods but I'm not getting it.

Original Q&A

There are 4 best solutions below

**Mark** · Answer 1 · 2023-09-24T21:45:49.647000

df['Remaining Quantity'] = df.groupby('Class').apply(
    lambda x: x['Received'].cumsum() - x['Issued'].cumsum()
    ).reset_index(level=0, drop=True)

Output:

  Class  Received  Issued  Remaining Quantity
0    FD        10       0                  10
1    FD         0       2                   8
2    RM         5       0                   5
3    RM         0       3                   2
4    FD         0       2                   6
5    PM         5       0                   5
6    PM         1       0                   6
7    RM         1       0                   3
8    FD         4       0                  10

**Timeless** · Answer 2 · 2023-09-24T21:50:11.130000

Another possible solution :

df["Remaining Quatity"] = (
    df.eval("tmp=Received-Issued").groupby("Class")["tmp"].cumsum()
)

Output :

print(df)

  Class  Received  Issued  Remaining Quatity
0    FD        10       0                 10
1    FD         0       2                  8
2    RM         5       0                  5
3    RM         0       3                  2
4    FD         0       2                  6
5    PM         5       0                  5
6    PM         1       0                  6
7    RM         1       0                  3
8    FD         4       0                 10

**Andrej Kesely** · Answer 3 · 2023-09-24T21:55:11.273000

Another solution:

df["Remaining Quatity"] = (g := df.groupby("Class").cumsum())["Received"] - g["Issued"]
print(df)

Prints:

  Class  Received  Issued  Remaining Quatity
0    FD        10       0                 10
1    FD         0       2                  8
2    RM         5       0                  5
3    RM         0       3                  2
4    FD         0       2                  6
5    PM         5       0                  5
6    PM         1       0                  6
7    RM         1       0                  3
8    FD         4       0                 10

OR: Using .pipe:

df["Remaining Quatity"] = df.groupby("Class").cumsum().pipe(lambda g: g["Received"] - g["Issued"])

OR: Using .eval:

df["Remaining Quatity"] = df.groupby("Class").cumsum().eval("Received - Issued")

**Umar.H** · Answer 4 · 2023-09-24T21:57:34.810000

One way using .stack to compute the difference and then assigning the value back along the index.

df['Remaining Quality'] = df.assign(
            Issued=df['Issued'] * -1).set_index('Class',append=True)\
           .stack().groupby(level=1).cumsum().unstack(-1).droplevel(1,0)['Issued']

print(df)

  Class  Received  Issued  Remaining Quality
0    FD        10       0                 10
1    FD         0       2                  8
2    RM         5       0                  5
3    RM         0       3                  2
4    FD         0       2                  6
5    PM         5       0                  5
6    PM         1       0                  6
7    RM         1       0                  3
8    FD         4       0                 10

Using groupby and cumsum to get a new column in pandas

There are 4 best solutions below

Related Questions in PYTHON

Related Questions in PANDAS

Related Questions in CUMSUM

Trending Questions

Popular # Hahtags

Popular Questions