Rows

class optimus.engines.base.rows.BaseRows(root: DataFrameType)[source]

Base class for all Rows implementations

append(dfs: DataFrameTypeList, names_map=None) DataFrameType[source]

Appends 2 or more dataframes :param dfs: :param names_map:

apply(func, args=None, output_cols=None, mode='vectorized') DataFrameType[source]

This will aimed to handle vectorized and not vectorized operations :param func: :param args: :param output_cols: :param mode: :return:

approx_count() DataFrameType[source]

Aprox count :return:

array(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

between(cols='*', lower_bound=None, upper_bound=None, equal=True, bounds=None, drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • lower_bound

  • upper_bound

  • equal

  • bounds

  • drop

  • how

Returns

between_index(lower_bound=None, upper_bound=None, cols='*')[source]
Parameters
  • columns

  • lower_bound

  • upper_bound

Returns

boolean(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

contains(cols='*', value=None, drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • drop

  • how

Returns

count(compute=True) int[source]

Count dataframe rows

credit_card_number(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

datetime(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

drop(where) DataFrameType[source]

Drop rows depending on a mask or an expression :param where: Mask, expression or name of the column to be taken as mask :return: Optimus Dataframe

drop_arrays(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_between(cols='*', lower_bound=None, upper_bound=None, equal=True, bounds=None, how='any') DataFrameType[source]
Parameters
  • cols

  • lower_bound

  • upper_bound

  • equal

  • bounds

  • how

Returns

drop_booleans(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_by_data_type(cols='*', data_type=None, how='any') DataFrameType[source]
Parameters
  • cols

  • data_type

  • how

Returns

drop_by_expression(where=None, cols='*', how='any') DataFrameType[source]
Parameters
  • where

  • cols

  • how

Returns

drop_by_regex(cols='*', regex=None, how='any') DataFrameType[source]
Parameters
  • cols

  • regex

  • how

Returns

drop_contains(cols='*', value=None, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • how

Returns

drop_credit_card_numbers(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_datetimes(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_duplicated(cols='*', keep='first', how='any') DataFrameType[source]
Parameters
  • cols

  • keep

  • how

Returns

drop_emails(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_empty(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_ends_with(cols='*', value=None, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • how

Returns

drop_equal(cols='*', value=None, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • how

Returns

drop_find(cols='*', value=None, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • how

Returns

drop_float(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_genders(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_greater_than(cols='*', value=None, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • how

Returns

drop_greater_than_equal(cols='*', value=None, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • how

Returns

drop_http_codes(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_int(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_ips(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_less_than(cols='*', value=None, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • how

Returns

drop_less_than_equal(cols='*', value=None, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • how

Returns

drop_match(cols='*', regex=None, data_type=None, how='any') DataFrameType[source]
Parameters
  • cols

  • regex

  • data_type

  • how

Returns

drop_mismatch(cols='*', data_type=None, how='any') DataFrameType[source]
Parameters
  • cols

  • data_type

  • how

Returns

drop_missings(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_nan(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_none(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_not_equal(cols='*', value=None, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • how

Returns

drop_nulls(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_numeric(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_objects(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_pattern(cols='*', pattern=None, how='any') DataFrameType[source]
Parameters
  • cols

  • pattern

  • how

Returns

drop_phone_numbers(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_social_security_numbers(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_starts_with(cols='*', value=None, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • how

Returns

drop_str(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_uniques(cols='*', keep='first', how='any') DataFrameType[source]

Drops first (passed to keep) matches of duplicates and unique values. :param cols: :param keep: :param how: :return: Dataframe

drop_urls(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

drop_value_in(cols='*', values=None, how='any') DataFrameType[source]
Parameters
  • cols

  • values

  • how

Returns

drop_zip_codes(cols='*', how='any') DataFrameType[source]
Parameters
  • cols

  • how

Returns

duplicated(cols='*', keep='first', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • keep

  • drop

  • how

Returns

email(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

empty(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

ends_with(cols='*', value=None, drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • drop

  • how

Returns

equal(cols='*', value=None, drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • drop

  • how

Returns

expression(where=None, cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • where

  • cols

  • drop

  • how

Returns

find(cols='*', value=None, drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • drop

  • how

Returns

float(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

gender(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

greater_than(cols='*', value=None, drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • drop

  • how

Returns

greater_than_equal(cols='*', value=None, drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • drop

  • how

Returns

http_code(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

int(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

ip(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

less_than(cols='*', value=None, drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • drop

  • how

Returns

less_than_equal(cols='*', value=None, drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • drop

  • how

Returns

limit(count=10) DataFrameType[source]

Limit the number of rows :param count: :return:

match(cols='*', regex=None, data_type=None, drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • regex

  • data_type

  • drop

  • how

Returns

match_data_type(cols='*', data_type=None, drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • data_type

  • drop

  • how

Returns

match_regex(cols='*', regex=None, drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • regex

  • drop

  • how

Returns

mismatch(cols='*', data_type=None, drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • data_type

  • drop

  • how

Returns

missing(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

nan(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

none(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

not_equal(cols='*', value=None, drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • drop

  • how

Returns

null(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

numeric(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

object(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

pattern(cols='*', pattern=None, drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • pattern

  • drop

  • how

Returns

phone_number(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

reverse() DataFrameType[source]
Returns

select(expr=None, contains=None, case=None, flags=0, na=False, regex=False) DataFrameType[source]

Return selected rows using an expression :param expr: Expression used, For Ex: (df[“A”] > 3) & (df[“A”] <= 1000) or Column name “A” :param contains: List of string :param case: :param flags: :param na: :param regex: :return:

social_security_number(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

sort(cols='*', order='desc', cast=True) DataFrameType[source]

Sort rows taking into account multiple columns :param cols: :param order: :param cast: cast rows before sorting them.

starts_with(cols='*', value=None, drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • value

  • drop

  • how

Returns

str(cols='*', drop=False, how='any') DataFrameType[source]

#TODO:? :param cols: :param drop: :param how: :return:

to_list(input_cols) list[source]
Parameters

input_cols

Returns

unique(cols='*', keep='first', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • keep

  • drop

  • how

Returns

static unnest(cols) DataFrameType[source]
Parameters

cols

Returns

url(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns

value_in(cols='*', values=None, drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • values

  • drop

  • how

Returns

zip_code(cols='*', drop=False, how='any') DataFrameType[source]
Parameters
  • cols

  • drop

  • how

Returns