acep_clean {ACEP} | R Documentation |
Limpieza de texto.
Description
Funcion que limpia y normaliza las notas/textos.
Usage
acep_clean(
x,
tolower = TRUE,
rm_cesp = TRUE,
rm_emoji = TRUE,
rm_hashtag = TRUE,
rm_users = TRUE,
rm_punt = TRUE,
rm_num = TRUE,
rm_url = TRUE,
rm_meses = TRUE,
rm_dias = TRUE,
rm_stopwords = TRUE,
rm_shortwords = TRUE,
rm_newline = TRUE,
rm_whitespace = TRUE,
other_sw = NULL,
u = 1
)
Arguments
x |
vector de textos al que se le aplica la funcion de limpieza de texto. |
tolower |
convierte los textos a minusculas. |
rm_cesp |
remueve caracteres especiales. |
rm_emoji |
remueve los emojis. |
rm_hashtag |
remueve los hashtags. |
rm_users |
remueve las menciones de usuarixs de redes sociales. |
rm_punt |
remueve la puntuacion. |
rm_num |
remueve numeros. |
rm_url |
remueve las url. |
rm_meses |
remueve los meses del anio. |
rm_dias |
remueve los dias de la semana. |
rm_stopwords |
remueve palabras vacias. |
rm_shortwords |
remueve las palabras cortas. |
rm_newline |
remueve los saltos de linea. |
rm_whitespace |
remueve los espacios en blanco. |
other_sw |
su valor por defecto es NULL, sirve para ampliar el listado de stopwords con un nuevo vector de palabras. |
u |
umbral de caracteres para la funcion rm_shortwords. |
Examples
acep_clean("El SUTEBA fue al paro. Reclaman mejoras salariales.", rm_cesp = FALSE)
[Package ACEP version 0.0.22 Index]