Artículo de investigación

Propiedades psicométricas de una escala de Depresión basada en el Modelo de los Cinco Factores

Psychometric properties of a Depression scale based on the Five Factor Model

Facundo Juan Pablo Abal

Universidad de Buenos Aires (Argentina) y Consejo Nacional de Investigaciones Científicas y Técnicas (Argentina).

https://orcid.org/0000-0001-7023-5380

Gabriela Susana Lozzia

Universidad de Buenos Aires (Argentina). https://orcid.org/0000-0001-7753-6303

Horacio Félix Attorresi

Universidad de Buenos Aires (Argentina).

http://orcid.org/0000-0002-3027-1069

Correspondencia: fabal@psi.uba.ar


Resumen

Se presenta el proceso de construcción de una escala para medir la faceta Depresión según el Modelo de los Cinco Factores. Se realizó una revisión de las definiciones teóricas y operacionales de autores relevantes de este modelo. Luego se elaboraron 15 ítems iniciales, 3 de los cuales fueron eliminados por jueces expertos. Los ítems conservados se administraron a 1222 adultos de población general residentes en el área metropolitana de Buenos Aires, Argentina (50.8 % mujeres, edad media = 33.2 años y DE = 11.8 años). Se seleccionó aleatoriamente un 35% de casos para depurar el instrumento con un análisis factorial exploratorio. El 65% restante se utilizó para corroborar la estructura interna con un análisis factorial confirmatorio y para ajustar el Modelo de Respuesta Graduada de la Teoría de Respuesta al Ítem. Los resultados muestran que los 10 ítems de la versión definitiva conforman una estructura unidimensional con adecuada consistencia interna. Se aportan evidencias de validez concurrente con EPQ-RA y SCL-90-R. La Función de Información revela que la escala mide con precisión elevada y constante en un rango extenso del rasgo. Se concluye que la escala permite valorar de manera satisfactoria las diferencias individuales en la tendencia a experimentar afectos depresivos.

Palabras claves: Depresión, Modelo de los Cinco Factores, Modelo de los Cinco grandes, Modelo de Respuesta Graduada, Teoría de Respuesta al Ítem.


Abstract

The process of constructing a scale to measure the Depression facet, according to the Five Factors Model, is presented. A review of the theoretical and operational definitions of relevant authors of this model was carried out. Then, 15 initial items were elaborated, 3 of which were eliminated by expert judges. The retained items were administered to 1222 adults of the general population residing in the Buenos Aires Metropolitan Area, Argentina (50.8% women, mean age = 33.2 years and SD = 11.8 years). A random selection of 35% of cases was made to reduce the instrument with an Exploratory Factor Analysis. The remaining 65% was used to corroborate the internal structure with a Confirmatory Factor Analysis, and to fit the Graded Response Model of the Item Response Theory. The results show that the 10 items of the final version form a one-dimensional structure with adequate internal consistency. Evidence of concurrent validity is provided with EPQ-RA and SCL-90-R. The Test Information Function reveals that the scale measures with constant high reliability over a wide range of the trait. It is concluded that the scale allows a satisfactory assessment of individual differences in the tendency to experience depressive effects.

Keywords: Depression, Five Factor Model, Big Five Model, Graded Response Model, Item Response Theory.

Fecha de recepción: 11 de junio de 2019
Fecha de aceptación: 21 de octubre de 2020


Introducción

La depresión es una emoción que se caracteriza por una disminución en el nivel de actividad del sujeto originada frente a situaciones que suponen algún tipo de pérdida, daño o perjuicio (Verduyn, Résibois & Massar, 2017). Desde una aproximación evolucionista se le han reconocido funciones filogenéticas adaptativas. La disminución en el ritmo de la actividad le permite al individuo conservar energías para enfrentar futuros procesos de adaptación, potenciar la introspección y despertar sentimientos de compasión en los demás con el objetivo de hacer cesar agresiones en su contra o motivar comportamientos de ayuda (Huron, 2018). Las personas con una mayor propensión a responder con depresión podrían tener más probabilidad de obtener la ayuda y el apoyo de otros para superar los acontecimientos negativos de la vida (Widiger, 2009). Sin embargo, la falta de claridad con respecto a cuándo y con qué intensidad se debería experimentar es el origen de importantes diferencias individuales (Penke, Denissen & Miller, 2007).

En el marco de las teorías de los rasgos son numerosos los modelos desarrollados que consideran a la tendencia a experimentar afectos depresivos como unidad de análisis para abordar las diferencias individuales de la personalidad normal. A nivel histórico la mención más concreta remite a Eysenck, quien caracterizó por primera vez el factor Neuroticismo y definió a la depresión como uno de sus rasgos primarios (Eysenck & Eysenck, 1975). En la actualidad, la depresión se consolidó como rasgo de la personalidad en virtud del lugar que ocupa como una de las facetas del Neuroticismo en el Modelo de los Cinco Factores -Five Factor Model, FFM- (Goldberg, 1993; McCrae & Costa, 2010). Asimismo, se postuló su variante desadaptativa, llamada Tendencia Depresiva, como parte del modelo dimensional propuesto en el DSM-5 (American Psychiatric Association, 2013) para los trastornos de la personalidad.

Faceta Depresión en el Modelo de los Cinco Factores

La aparición de depresión es recurrente en los modelos del FFM más reconocidos derivados tanto de la tradición léxica (Goldberg, 1993; Hofstee, de Raad & Goldberg, 1992; Watson, Nus & Wu, 2017) como de la tradición que se basa en el análisis de cuestionarios de personalidad (Johnson, 2014; McCrae & Costa, 2010). Sin embargo, a pesar de los consensos alcanzados, una revisión de las delimitaciones conceptuales que los distintos autores hacen del constructo deja en evidencia algunas diferencias en los contenidos muestreados de las respectivas operaciona-lizaciones. Estas variaciones podrían causar discrepancias entre las mediciones obtenidas con los instrumentos (Ormel et al., 2013).

A partir de un planteo racional Costa y McCrae (1995) asentaron la definición teórica de la faceta Depresión en la emoción sorrow (tristeza intensa). Como afirma Parrot (2016), sorrow es un término poco frecuente para la psicología moderna y habitualmente es utilizado como sinónimo de sadness (tristeza). Pero este no parece ser el caso de Costa y McCrae. En un análisis semántico realizado por Wierzbicka (1999), sorrow remite una experiencia de distrés personal más intensa y duradera de la que se alude con sadness. Es en este sentido que la faceta Depresión no se reduce una disposición a sentir tristeza (sadness) sino que engloba además sentimientos de soledad y/o desesperanza.

Efectivamente, el punto de acuerdo más importante entre teóricos del FFM (Goldberg, 1999; Johnson, 2014, McCrae & Costa, 2010; Soto & John, 2016; Taylor & DeBruin, 2006; Watson et al., 2017) es definir a la faceta Depresión como la disposición a experimentar afectos depresivos, entre los que se destaca la mención de la tristeza (sadness). En las definiciones teóricas son mencionados adicionalmente los sentimientos de soledad, culpa y abatimiento. Pero al revisar los ítems usados en las operacionalizaciones, no todos los instrumentos incorporan elementos concretos que remitan explícitamente a estos contenidos.

El otro aspecto sobre el que convergen la mayoría de las definiciones para Depresión es la preponderancia de una evaluación negativa de sí mismo, de la vida en general (pesimismo) y del futuro (desesperanza). Como señala Simms (2009), estos tres componentes remiten a la tríada cognitiva de la Depresión postulada por Beck (Beck, Rush, Shaw & Emery, 1979) y podrían ser medidas como subfa-cetas separadas en un nivel estructural aún más bajo del que se contempla en el FFM. Para Beck y sus colaboradores, las personas subclínicamente depresivas representan el final de un continuo de severidad en cuyo extremo opuesto se encuentra la depresión clínica. El contenido de estos tres aspectos es el factor común más prevalente entre las definiciones operacionales de la Depresión desde la perspectiva del FFM.

La mayor disidencia se observa frente a la inclusión o no de la labilidad del estado del ánimo como parte de Depresión. Los instrumentos diseñados por Goldberg (1999) y Watson et al. (2017) contienen ítems que remiten a cambios frecuentes en el ánimo, aunque no esto no aparece reflejado en las definiciones teóricas de la Depresión dadas por estos autores. Otras taxonomías, en cambio, han destacado la relevancia de este indicador como para proponer una faceta específica en el interior del Neuroticismo (Saucier, 2002; Soto & John, 2016; Taylor & DeBruin, 2006).

Finalmente, la mayoría de los teóricos caracterizan los niveles bajos de Depresión como una escasa tendencia a experimentar emociones depresivas. Esta aclaración es importante porque implica que el polo opuesto a Depresión es independiente de la propensión a sentir emociones positivas (vinculado a la dimensión Extroversión en el FFM). La excepción se encuentra en la faceta Felicidad del AB5C-IPIP (Hofstee et al., 1992). Esta denominación resulta particularmente engañosa porque sus ítems recogen contenidos vinculados a afectos negativos, que posteriormente son codificados de manera inversa para guardar coherencia con el nombre usado para la escala.

Medición de la faceta Depresión

La conveniencia de evaluar los rasgos de la personalidad con medidas estrechas o amplias aun no presenta resultados concluyentes. No obstante, diversos estudios han señalado que al eliminar las variaciones introducidas por las demás facetas en la medición de un dominio es posible extraer conclusiones más precisas y específicas con respecto a la relación entre el rasgo y el criterio (e.g. Naragon-Gainey & Watson, 2014; Rector, Bagby, Huta & Ayearst, 2012). En consecuencia, se puede aumentar la validez predictiva al identificar y medir únicamente las facetas más importantes en función del criterio.

En particular, Depresión mostró ser la faceta de Neuroticismo más eficaz para predecir el bienestar subjetivo (Anglim & Grant, 2016; Siegler & Brummett, 2000) y la satisfacción con la vida (R0ysamb, Nes, Czajkowski & Vassend, 2018; Schimmack, Oishi, Furr & Funder, 2004). Aunque en menor medida, esta faceta también resultó importante en el estudio de la satisfacción marital (Disney, 2011; Renshaw, Blais & Smith, 2010) y satisfacción con el trabajo (Steel, Schmidt, Bos-co & Uggerslev, 2019). En el contexto clínico, los individuos con un nivel más alto de Depresión no solo tienen predisposición a desarrollar trastornos del estado de ánimo (Rector et al., 2012; Xi et al., 2018) sino que también podrían mostrar otros indicadores clínicamente relevantes, tales como ideación suicida (Chio-queta & Stiles, 2005), alexitimia (Luminet, Bagby, Wagner, Taylor & Parker, 1999) y preocupación por el cuerpo y la comida característicos de los trastornos de la conducta alimentaria (Ellickson-Larew, Naragon-Gainey & Watson, 2013).

La mayoría de las escalas usadas para medir la faceta Depresión según el FFM se han diseñado y validado utilizando a la Teoría Clásica de Test (TCT). Pero el proceso de construcción de instrumentos se ha refinado con el avance de la Teoría de Respuesta al ítem (TRI) en la modelización constructos de la personalidad (Atto-rresis Lozzia, Abal, Galibert & Aguerri, 2009; Hidalgo-Montesinos & French, 2016; Reise & Revicki, 2015). La psicometría actual aboga por el uso complementario de ambas teorías para aumentar los estándares de calidad en la medición (Muñiz, 2018). Sin embargo, la aplicación de la TRI a tests validados previamente con TCT no siempre resulta viable. La TRI impone supuestos más rigurosos a los datos con análisis cualitativos y cuantitativos más exigentes para los ítems (Abal, Lozzia, Aguerri, Galibert & Attorresi, 2010; Reise & Rodriguez, 2016). Esto ha promovido que los nuevos instrumentos del FFM que usan TRI se diseñen con ítems originales (e.g. Nieto et al., 2017; Stark, Chernyshenko, Drasgow & White, 2012) o seleccionados cuidadosamente de un pool más amplio (e.g. Maples-Keller et al., 2017).

Objetivo

La tendencia a experimentar afectos depresivos ha demostrado tener relevancia en relación con el proceso de salud-enfermedad, y es por esto que fue aislada como una faceta de la personalidad en el FFM. En este trabajo se propone la construcción de un test para la medición de la faceta Depresión según las definiciones revisadas del FFM. El objetivo general es presentar el análisis de sus propiedades psicométricas siguiendo la metodología que combine TCT y TRI.

Método

Participantes

Se contó con la colaboración de 1222 personas (50.8 % mujeres y 49.2 % varones) residentes en el área metropolitana de Buenos Aires, Argentina. Los sujetos se seleccionaron a partir de un muestreo no probabilístico por accesibilidad. La edad de los participantes osciló entre 18 y 82 años, siendo el promedio de 33.2 años (DE = 11.8 años). Con respecto a la situación laboral, un 78.8 % consignó realizar algún tipo de actividad de medio tiempo o tiempo completo. El nivel educativo era medio-alto, dado que el 55.1 % registró como máximo estudios secundarios y solo un 6.2 % se posicionó por debajo de este nivel. El resto de los participantes completó estudios terciarios (17.5 %) y universitarios (21.2 %).

Instrumentos

Cuestionario de Datos personales. Indaga aspectos vinculados al género, edad, estado civil, lugar de nacimiento, lugar de residencia, situación laboral y niveles de estudios alcanzados. Este cuestionario fue diseñado ad-hoc para los fines de esta investigación.

Ítems para la medición de la faceta Depresión. A partir de la revisión de las diferentes operacionalizaciones de Depresión se construyó un mapa conceptual del cons-tructo en el que se sintetizan los indicadores que se reconocen en cada uno de los instrumentos y su frecuencia de aparición (tabla 1). Se realizó una compilación y posterior selección de 15 ítems procedentes de diversos instrumentos que evalúan el rasgo Depresión y otros constructos vinculados. Estos ítems fueron reformulados para que se correspondan con los aspectos considerados por la mayoría de los autores del FFM. Se diseñó un formato de respuesta tipo Likert de cuatro categorías (En desacuerdo, Ligeramente en desacuerdo, Ligeramente de acuerdo y De acuerdo). Tras la depuración realizada por los jueces expertos fueron conservados 12 ítems, los cuales fueron administrados a los participantes de esta investigación. Tres de estos reactivos aparecen redactados en sentido inverso (tabla 2).

Eysenck Personality Questionary revised short version. EPQ-RA (Eysenck & Eysenck, 1975; adaptación de Squillace, Picón Janeiro & Schmidt, 2013). Mide las tres dimensiones básicas de la personalidad postuladas en el modelo de Eysenck (Extraversión, Neuroticismo y Psicoticismo) y un cuarto factor de Sinceridad en las respuestas. Se compone de 42 ítems con formato de respuesta dicotómico (Sí-No). Los adaptadores locales de la prueba replicaron la estructura factorial de la prueba y reportaron índices de consistencia interna aceptables para las escalas (KR-20 entre .66 y .84). En la muestra de este estudio el análisis de consistencia interna mostró valores de KR-20 similares, aunque ligeramente más elevados (entre .69 y .86).

Inventario de síntomas SCL-90-R (Derogatis, 1994). Consta de 90 ítems que indagan sobre la intensidad con que se han experimentado diversos síntomas psicológicos durante los últimos siete días (Nada, Muy poco, Poco, Bastante y Mucho). Los ítems se agrupan para posibilitar la medición de nueve dimensiones clínicas (Somatización, Obsesiones y Compulsiones, Sensitividad Interpersonal, Depresión, Ansiedad, Hostilidad, Ansiedad Fóbica, Ideación Paranoide y Psicoticismo) y tres índices globales (Índice de Severidad Global, Total de Síntomas Positivos e Índice de Malestar Positivo). La adaptación local muestra evidencias de validez y estudios de confiabilidad adecuados tanto para población clínica (Sánchez & Ledesma, 2009) como no clínica (Casullo, 2004). La consistencia interna de todos los ítems del inventario mostró un Alfa de Cronbach de .96 en la muestra de este estudio, mientras que para las dimensiones clínicas este coeficiente osciló entre .77 y .86.

Procedimiento

Cinco expertos examinaron a ciegas la congruencia de los enunciados entre los 15 ítems propuestos inicialmente y la definición de la faceta de McCrae y Costa (2010). Se escogió la de estos autores entre todas las reseñadas por resultar la más abarcadora. El juicio experto se complementó con la aplicación de los ítems en un estudio piloto (n = 26).

La muestra grande de participantes contestó el protocolo depurado en formato lápiz-papel de manera individual y sin tiempo límite. Previa administración se les explicitó que la tarea consistía en dar respuesta a una serie de inventarios que perseguían evaluar características de su personalidad. Se los informó sobre el carácter voluntario de su participación y la posibilidad de abandonar la evaluación en cualquier momento de la actividad. También se les comunicó sobre las garantías de anonimato y confidencialidad de sus respuestas. Todas estas condiciones fueron explicitadas además en la redacción del consentimiento que debieron firmar los sujetos para participar.

Análisis de datos

Depuración del instrumento. En la primera etapa de la depuración se examinaron las respuestas de los jueces expertos y se adoptó como criterio de aceptación un límite inferior del intervalo de confianza del V de Aiken > .60 para un nivel de confianza del 90 %.

Los casos obtenidos en la muestra grande se dividieron de manera aleatoria en dos subgrupos. Se utilizó un 35 % de los sujetos (n=428) para llevar adelante una reducción de ítems mediante un Análisis Factorial Exploratorio (AFE) con el programa FACTOR 9.2 (Lorenzo-Seva & Ferrando, 2013). La eliminación progresiva de ítems se realizó atendiendo a la unidimensionalidad del constructo conforme se caracteriza desde el FFM. Se respetó el carácter ordinal de los datos, por lo que se analizó la matriz de correlaciones policóricas. Se consideró el método de mínimos cuadrados no ponderados (ULS, Unueighted Least Squares) para la extracción de factores y la implementación óptima de análisis paralelo (Timmerman & Lorenzo-Seva, 2011) como criterio para la retención de los mismos. Se conservaron los ítems que presentaron cargas factoriales iguales o superiores a .40.

Estudios de validez y confiabilidad. Luego de la depuración se analizaron los datos considerando la versión definitiva de la escala. Estos estudios se efectuaron con el 65 % de la muestra (n=794) no utilizado en la fase de depuración. Se buscó replicar la estructura unidimensional mediante un Análisis Factorial Confirmatorio (AFC) con el programa Mplus (Muthén & Muthén, 2010). Se estimaron los parámetros con el método de mínimos cuadrados ponderados robustos (Weighted Least Squares Mean and Variance Adjusted, WLSMV) a partir de la matriz de correlaciones policóricas. El ajuste se examinó usando el índice de ajuste comparativo (CFI), el índice de Tucker-Lewis (TLI) y el error medio cuadrático de aproximación (RMSEA) considerando los parámetros recomendados habitualmente en la literatura psicométrica (e.g. Byrne, 2012): CFI y TLI > .90 y RMSEA < .08.

El estudio de la estructura interna se profundizó desde la perspectiva de la TRI con la aplicación del Modelo de Respuesta Graduada (MRG) de Samejima (2016). El AFC realizado previamente sirvió para verificar el supuesto de unidimensio-nalidad requerido por el MRG. Para corroborar el supuesto de independencia local de los ítems se usó el estadístico x2LD de Chen y Thissen (1997). Siguiendo a Reise y Rodriguez (2016), los valores de %2LD > 10 permiten concluir dependencia local entre los ítems.

Los parámetros de los ítems y sujetos se estimaron usando el método de Máxima Verosimilitud Marginal. La implementación de este análisis se realizó con el software IRTPRO 4.2 (Cai, Thissen & du Toit, 2011). El MRG contempla, para cada ítem, un parámetro de pendiente (a) y tres parámetros de localización (b, b, b3) que permiten posicionar en la misma escala del rasgo los umbrales que separan las opciones de respuesta adyacentes. Estos parámetros sirvieron para graficar las curvas características de los ítems. También se estimaron 794 parámetros θ para cuantificar el nivel de Depresión de cada individuo. El ajuste del MRG se estudió a nivel el ítem con el índice S-%2, para el que se consideró un p > .05 como indicativo de ajuste aceptable (Kang & Chen, 2011).

A partir de los θ estimados se buscaron evidencias de validez de basadas en la relación de la Depresión con otras variables medidas por el EPQ-RAy SCL-90-R. Finalmente, se calcularon los coeficientes alfa de Cronbach, alfa ordinal y omega ordinal con el objetivo de estimar la confiabilidad basada en la consistencia interna. Para cada uno de los coeficientes se calcularon los respectivos intervalos de confianza del 95 % con la técnica de boostrap usando el método de sesgo corregido y acelerado (BCa; Kelley & Pornprasertmanit, 2016). Estos cálculos se realizaron operando el programa R a partir de la función scale Reliability del paquete userfriendlyscience (Peters, 2014). En el marco de la TRI se estudió la precisión de la medida mediante el coeficiente de fiabilidad marginal y las funciones de información y del error estándar correspondientes al test completo.

Resultados

Depuración del instrumento

Juicio experto y prueba piloto. Se eliminaron 3 de los 15 de los ítems elaborados inicialmente porque no cumplieron con criterios de calidad suficientes según la opinión de los expertos (límite inferior del 90 %IC de V de Aiken < .60). En la tabla 2 se reproducen los coeficientes V de Aiken obtenidos para los ítems conservados con sus respectivos intervalos de confianza. Con respecto a la prueba piloto no se detectaron grandes dificultades en la comprensión del contendido de los ítems ni la consigna de administración.

Análisis Factorial Exploratorio. Se efectuó una reducción de los ítems en etapas sucesivas. Las matrices factoriales obtenidas al inicio y finalización de la depuración aparecen en la tabla 2. La implementación óptima del análisis paralelo de Horn realizado sobre la matriz de correlaciones policóricas de los 12 ítems sugirió la extracción de un único factor. Siguiendo el criterio de eliminar los ítems con saturaciones factoriales inferiores a .40 se descartaron progresivamente los ítems 5 y 2. Los resultados finales confirman que los ítems conservados configuran una estructura unidimensional del constructo y no resulta necesario eliminar ningún otro elemento.

Estudios de validez y confiabilidad

Análisis Factorial Confirmatorio. Tanto los índices de ajuste comparativos (CFI = .959 y TLI = .947) como el índice de ajuste absoluto RMSEA = .075 (IC 90 % .065 -.086) registraron valores adecuados, los cuales permiten aceptar razonablemente la unidimensionalidad del constructo Depresión. Todas las cargas factoriales (tabla 3) fueron estadísticamente significativas (p<.05). Estos resultados replican la estructura interna obtenida con la submuestra del AFE.

Modelo de Respuesta Graduada. El AFC realizado corrobora el supuesto de unidimensionalidad que demanda el MRG. Los estadísticos %2LD para el estudio de la independencia local de los ítems presentaron valores entre y 8.1, garantizando el cumplimiento de este segundo supuesto del modelo.

El proceso iterativo de estimación de los parámetros de los ítems alcanzó el criterio de convergencia de .0001 en el ciclo 26. Los estadísticos S-%2 que aparecen en la tabla 3, señalan que todos los ítems mostraron un ajuste satisfactorio al MRG (p > .05). Los parámetros de discriminación revelaron que la escala presenta valores entre moderados y altos de pendiente siendo el promedio de a de 1.41 (DE = 0.41). El parámetro más alto (a = 2.08) perteneció al ítem 3 mientras que el más bajo (a = 0.74) fue del ítem 4. Como se observa en la tabla 2, los parámetros de umbral se posicionaron en un rango amplio del rasgo latente, al oscilar entre -2.26 (b ítem 4) y 3.25 (b3 ítem 2). Los θ estimados para los 794 sujetos oscilaron entre -2.07 y 2.58, con una media de -0.005 (DE =0.9).

La figura 1 exhibe las curvas características de los diez ítems de la prueba. En tér- 2021 minos generales, se registró que las alternativas de respuesta de los ítems permitieron discriminar en algún rango específico del rasgo latente. Sin embargo, se observan excepciones en una categoría de los ítems 4 y 6, para los cuales la opción En desacuerdo tiende a prevalecer por sobre Ligeramente en desacuerdo en la mayoría de los sujetos con niveles bajos del rasgo. El caso más extremo se identificó en el ítem 12, dado que su contenido origina una tendencia a la polarización de los sujetos en las categorías En desacuerdo y De acuerdo sin que demuestren eficacia las opciones centrales.

Relación con otros instrumentos. Se calcularon correlaciones de Pearson entre los θ de Depresión y las escalas EPQ-RA y SCL-90-R (tabla 4). Se obtuvieron asociaciones relativamente altas con los constructos más fuertemente emparentados desde un punto de vista teórico. Específicamente, la correlación con la dimensión Neuroticismo de la prueba EPQ-RA (r =.72) y Depresión del SCL-90-R (r = .69). También se registraron asociaciones moderadas con Sensitividad Interpersonal y el Índice de Severidad Global. Como era de esperarse, el resto de las correlaciones resultaron positivas (a excepción de Extraversión), pero relativamente más débiles.

Confiabilidad. Tanto el alfa de Cronbach = .82, 95 % IC método bootstrap [.80, .83] como las versiones ordinales de alfa = .86, 95 % IC método bootstrap [.84, .87] y omega = .86, 95 % IC método bootstrap [.84, .87] dan cuenta de una elevada consistencia interna de los ítems que componen la prueba. En la misma línea, un coeficiente de fiabilidad marginal de .84 también muestra que, globalmente, el instrumento obtiene medidas precisas. La Función de Información del Test (FIT) y su correspondiente Error Estándar revelan, en cambio, que esta precisión puede variar según el nivel del rasgo (figura 2). Si bien la FIT resultó relativamente simétrica, se observa un ligero desplazamiento del centro de la escala hacia los niveles medio-altos del rasgo (entre 0 y 1.2), en donde alcanza a ser máxima información. El error estimación del rasgo resultó igual o mayor a 0.5 (equivalente a una confiabilidad clásica de .75) para valores de θ menores a -1.7 y mayores a 2.5.

Discusión

El objetivo general de este trabajo fue presentar el proceso de construcción de una escala para la evaluación del rasgo Depresión. La revisión teórico-instru-mental realizada sobre diferentes operacionalizaciones de la faceta Depresión según el FFM permitió inscribir los ítems que componen esta escala en las definiciones conceptuales que se trabajan en el marco de este modelo. En la fase de depuración del instrumento se aportaron evidencias de validez suficientes tanto en un área de contenido como en un área formal (validez aparente). Una vez finalizada la depuración se procedió a obtener las propiedades psicométricas de la versión definitiva combinando la aplicación de la teoría clásica con la TRI acorde con los lineamientos metodológicos actuales en estudios instrumentales (Hidalgo-Montesinos & French, 2016; Muñiz, 2018).

Considerando que el instrumento persigue la evaluación de un rasgo de personalidad normal, en la selección y elaboración de los ítems se buscó que la redacción no remita explícitamente a sintomatología de depresión clínica, como ocurre en el Inventario de Depresión de Beck (Beck, Steer & Brown, 2006). Se recurrió, en cambio, a expresiones coloquiales que se aproximan más a la realidad que podrían manifestar sujetos de población general. También se procuró evitar que los enunciados de los ítems aludan o bien a afectos depresivos próximos entre sí (e.g. estoy decaído / estoy hundido), o bien a opuestos (e.g. me siento con energía / no tengo ganas de nada). Ambas características pueden observarse en los ítems de la escala rasgo del Inventario de Depresión Estado-Rasgo de Spielberger, Agudelo y Buela-Casal (2008). Los evaluados pueden mostrar dificultades para encontrar matices en la apreciación de sus experiencias emocionales cuando los enunciados indagan sobre contenidos excesivamente similares. Incluso pueden reaccionar con suspicacia bajo la presunción de que el cuestionario busca determinar si respondieron o no de manera coherente. A estos argumentos, que atañen a la validez aparente, se le debe sumar que la inclusión de ítems redundantes (por similitud o por oposición de contenidos) ponen en riesgo el supuesto de independencia local que requiere el MRG de la TRI (Abal et al., 2010).

El estudio factorial mostró que los diez elementos de la prueba conforman una única dimensión, brindando evidencias de validez acerca de la estructura interna del test. El ajuste del MRG ofreció más precisiones al análisis de los ítems, demostrando que, en términos generales, para la mayoría de los ítems las categorías de respuesta fueron máximamente probables en algún rango de valores de la variable. Si bien se observó la aparición de tres ítems que no satisfacen esta condición (ítems 4, 6 y 12), no parece recomendable la reducción de opciones para estos ítems porque resulta más parsimonioso conservar la uniformidad del mismo formato de respuesta para todos los elementos.

La correlación medio-alta entre los puntajes Depresión y Neuroticismo del Cuestionario EPQ-RA resulta acorde con lo esperable. Esta dimensión se ubica en el nivel más alto de una estructura jerárquica del modelo de la personalidad de Eysenck y se conforma a partir de las intercorrelaciones de un conjunto de rasgos primarios entre los que se incluyen los sentimientos de depresión, culpa y baja autoestima (Eysenck & Eysenck, 1975). El estudio de la asociación entre Depresión y las escalas del SCL-90-R también mostró resultados esperables desde una perspectiva teórica. Aun remitiendo a la personalidad normal, Depresión es un rasgo que describe una susceptibilidad a padecer trastornos psicopatoló-gicos (Tackett & Lahey, 2017). En este sentido, es coherente que los individuos con mayor nivel de Depresión tiendan a manifestar más sintomatología depresiva durante la última semana (Ormel et al., 2013). La misma explicación podría extenderse a la correlación registrada entre Depresión y los índices globales de SCL-90-R. En este caso, niveles elevados en Depresión se asocian con el padecimiento de mayor intensidad y/o variedad de síntomas psicológicos y, por ende, más malestar.

La confiabilidad de la medida evaluada a través de los índices de consistencia interna clásicos fue satisfactoria y se encuentra por encima de los valores habituales informados en la literatura para Depresión de los inventarios NEO. En efecto, el alfa de Cronbach reportado para esta faceta en el NEO-PI-3 (McCrae & Costa, 2010) y en la adaptación española del NEO-PI-R (Costa & McCrae, 2008) es de .78, aunque estas escalas constan de dos ítems menos. Complementariamente, la FIT permitió determinar que la fiabilidad de la escala es relativamente pareja en gran parte del espectro del rasgo, aunque con una mayor precisión en los niveles medio-altos de Depresión.

En suma, la escala construida en el presente trabajo reúne propiedades psico-métricas adecuadas para su uso para la valoración de las diferencias individuales en la faceta Depresión. Con respecto a las limitaciones de este estudio, futuras investigaciones buscarán aportar nuevas evidencias de validez recurriendo a estudios de funcionamiento diferencial de los ítems en función del género. Asimismo, ulteriores estudios se encaminarán hacia el análisis de la eficacia de la prueba para discriminar casos de depresión clínica y otras problemáticas. La asociación de este rasgo con diferentes indicadores clínicos muestra su potencial utilidad como una herramienta para pensar estrategias evaluativas de intervención y prevención desde un enfoque transdiagnóstico.

Financiamiento: Universidad de Buenos Aires (UBACyT20i8 20020170100200BA y UBACyT 2020 20020190200156BA) y Agencia Nacional de Promoción Científica y Tecnológica (PICT-2017-3226)


Referencias

Abal, F. J. P., Lozzia, G. S, Aguerri, M. E., Galibert, M. S. & Attorresi, H.F. (2010). La escasa aplicación de la Teoría de Respuesta al Ítem en Tests de Ejecución Típica. Revista Colombiana de Psicología, 19 (1), 111-122. Recuperado de: https://revistas.unal.edu.co/index.php/psicologia/article/view/10377/16955

American Psychiatric Association (2013). Diagnostic and statistical manual of mental disorders (5th ed.). Arlington, VA: American Psychiatric Publishing.

Anglim, J. & Grant, S. (2016). Predicting Psychological and Subjective Well-Being from Personality: Incremental Prediction from 30 Facets Over the Big 5. J Happiness Stud, 17, 59-80. https://doi.org/10.1007/s10902-014-9583-7

Attorresi, H. s Lozzia, G. S., Abal, 5F. J. P., Galibert, M. S. y Aguerri, M. E. (2009). Teoría de respuesta al ítem. Conceptos básicos y aplicaciones para la medición de constructos psicológicos. Revista Argentina de Clínica Psicológica, 18, 179-188. Recuperado de: https://www.redalyc.org/pdf/2819/281921792007.pdf

Beck, A., Rush, J., Shaw, B. & Emery, G. (1979). Terapia cognitiva de la depresión. Bilbao: Editorial Desclée de Brouwer.

Beck, A.T., Steer, R. A. & Brown, G.K (2006). Inventario de Depresión de Beck (2a ed.). Buenos Aires: Paidós.

Byrne, B.M. (2012). Structural equation modeling with Mplus: Basics, concepts, applications, and programming. Nueva York: Routledge.

Cai, L., Thissen, D. & du Toit, S. (2011). IRTPRO user's guide. Lincolnwood, IL: Scientific Software International.

Casullo, M. (2004). Síntomas psicopatológicos en adultos urbanos. Psicología y Ciencia Social, 6 (1), 49-57. Recuperado de: https://www.redalyc.org/pdf/314/31406105.pdf

Chen, W. & Thissen, D. (1997). Local dependence indices for item pairs using item response theory. Journal of Educational and Behavioral Statistics, 22, 265-289. https://doi.org/10.2307/1165285

Chioqueta, A. P. & Stiles, T. C. (2005). Personality traits and the development of depression, hopelessness, and suicide ideation. Personality and Individual Differences, 38, 1283-1291. https://doi.org/i0.i0i6/j.paid.2004.08.0i0.

Costa, P. T. & McCrae, R. R. (1995). Domains and facets: Hierarchical personality assessment using the revised NEO Personality Inventory. Journal of Personality Assessment, 64, 21-50. https://doi.org/10.1207/s15327752jpa6401_2

Costa, P. T. & McCrae, R. R. (2008). NEO PI-R. Inventario de Personalidad NEO Revisado [Revised NEO Personality Inventory]. Madrid: TEA Ediciones.

Derogatis, L. (1994). SCL-90-R. Symptom Checklist-90-R. Administration. Scoring and Procedures Manual. Minneapolis: National Computer System.

Disney, K. (2011). Personality Differences in Never-Married Versus Divorced Individuals In Later Life Using the NEO PI-R. All Theses and Dissertations (ETDs). 796. Recuperado de: http://openscholarship.wustl.edu/etd/796

Ellickson-Larew, S., Naragon-Gainey, K. & Watson, D. (2013). Pathological eating behaviors, BMI, and facet-level traits: The roles of conscientiousness, neuroti-cism, and impulsivity. Eating Behaviors, 14 (4), 428-431. https://doi.org/i0.i0i6/j.eatbeh.2013.06.015

Eysenck, H. J. & Eysenck, S. B. G. (1975). Manual of the Eysenck Personality Questionnaire. Londres: Hodder and Stoughton.

Goldberg, L. R. (1993). The structure of phenotypic personality traits. American Psychologist, 48, 26-34. https://doi.org/10.1037/0003-066X.48

Goldberg, L. R. (1999). A broad-bandwidth. public-domain. personality inventory measuring the lower-level facets of several five-factor models. En I. Mervielde, I. Deary, F. De Fruyt & F. Ostendorf (Eds.), Personality Psychology in Europe (vol. 7. pp. 7-28). Tilburg, The Netherlands: Tilburg University Press.

Hidalgo-Montesinos, M. D. & French, B. F. (2016). Una introducción didáctica a la Teoría de Respuesta al Ítem para comprender la construcción de escalas. Revista de Psicología Clínica con Niñosy Adolescentes, 3 (2), 13-21. Recuperado de https://dialnet.unirioja.es/servlet/articulo?codigo=5590670

Hofstee, W. K. B., de Raad, B., & Goldberg, L. R. (1992). Integration of the big five and circumplex approaches to trait structure. Journal of Personality and Social Psychology, 63, 146-163. https://doi.org/10.1037/0022-3514.63

Huron, D. (2018). On the Functions of Sadness and Grief. In H. Lench (Eds.), The Function ofEmotions (pp. 59-92). Springer: Cham. https://doi.org/10.1007/978-3-319-776i9-4_5

Johnson, J. A. (2014). Measuring thirty facets of the Five Factor Model with a 120-item public domain inventory: Development of the IPIP-NEO-120. Journal of Research in Personality, 51, 78-89. https://doi.org/10.1016Zj.jrp.2014.05.003

Kang, T. & Chen, T. T. (2011). Performance of the generalized S-X2 item fit index for the graded response model. Asia Pacific Education Review, 12 (1), 89-96. https://doi.org/i0.i007/si2564-0i0-9082-4

Kelley, K. & Pornprasertmanit, S. (20i6). Confidence intervals for population reliability coefficients: Evaluation of methods, recommendations, and software for composite measures. Psychological Methods, 21, 69-92. https://doi.org/i0.i037/a0040086

Lorenzo-Seva, U. & Ferrando, P. J. (20i3). FACTOR 9.2 A Comprehensive Program for Fitting Exploratory and Semiconfirmatory Factor Analysis and IRT Models. Applied Psychological Measurement, 37, 497-498. https://doi.org/i0.ii77/0i4662i6i3487794

Luminet, O., Bagby, R. M., Wagner, H., Taylor, G. J. & Parker, J. D. A. (i999). Relation Between Alexithymia and the Five-Factor Model of Personality: A Facet-Level Analysis. Journal of Personality Assessment, 73 (3), 345 - 358. https://doi.org/i0.i207/Si5327752JPA7303_4

Maples-Keller, J. L., Williamson, R. H., Sleep, C. E., Carter, N. T., Campbell, W. K. & Miller, J. D. (20i7). Using Item Response Theory to Develop a 60-Item Representation of the NEO PI-R Using the International Personality Item Pool: Development of the IPIP-NEO-60. Journal of Personality Assessment, 101 (i), 4-i5. https://doi.org/i0.i080/0022389i.20i7.i38i968

McCrae, R. R. & Costa, P. T., (20i0). NEO Inventories professional manual. Odessa, FL: Psychological Assessment Resources.

Muñiz, J. (20i8). Introducción a la Psicometría: teoría clásica y TRI. Madrid: Pirámide.

Muthén, L. & Muthén, B. (20i0). Mplus User's Guide, 6th Edn. Los Angeles, CA: Muthén y Muthén.

Naragon-Gainey, K. & Watson, D. (20i4). Consensually Defined Facets of Personality as Prospective Predictors of Change in Depression Symptoms. Assessment, 21 (4), 387-403. https://doi.org/i0.ii77/i073i9iii4528030.

Nieto, M. D., Abad, F. J., Hernández-Camacho, A., Garrido, L. E., Barrada, J. R., Aguado, D. & Olea, J. (20i7). Calibrating a new item pool to adaptively assess the Big Five. Psicothema, 29 (3), 390-395. https://doi.org/i0.7334/psicothema20i6.39i

Ormel, J., Jeronimus, B. F., Kotov, R., Riese, H., Bos, E. H., Hankin, B et al., (2013). Neuroticism and common mental disorders: meaning and utility of a complex relationship. Clin. Psychol. Rev, 33 (5), 686-697. https://doi.org/i0.i0i6/j.cpr.20i3.04.003

Parrot, P. G. (20i6). Sorrow. En V. Zeigler-Hill & T.K. Shackelford (Eds.), Encyclopedia of Personality and Individual Differences. Springer International Publishing. doi.org/i0.i007/978-3-3i9-28099-8_554-i.

Penke, L., Denissen, J. J. A. & Miller, G. F. (2007). The evolutionary genetics of personality. European Journal of Personality, 21, 549-587. https://doi.org/i0.i002/per.629.

Peters, G. J. Y. (20i4). The alpha and the omega of scale reliability and validity: Why and how to abandon Cronbach's alpha and the route towards more comprehensive assessment of scale quality. European Health Psychologist, 16 (2), 56-69. Recuperado de: https://www.ehps.net/ehp/index.php/contents/article/view/ehp.vi6.i2.p56/i.

Rector, N. A., Bagby, R. M., Huta, V. & Ayearst, L. E. (20i2). Examination of the trait facets of the five-factor model in discriminating specific mood and anxiety disorders. Psychiatry Res, 199 (2), i3i-i39. https://doi.org/i0.i0i6/j.psychres.20i2.04.027.

Reise, S. P. & Revicki, D.A. (20i5). Handbook of Item Response Theory Modeling Applications to Typical Performance Assessment. Nueva York: Routledge

Reise, S. P. & Rodriguez, A. (20i6). Item response theory and the measurement of psychiatric constructs: some empirical and conceptual issues and challenges. Psychol Med, 46 (i0), 2025 - 2039. https://doi.org/i0.i0i7/S003329i7i6000520.

Renshaw, K. D., Blais, R. K. & Smith, T. W. (20i0). Components of Negative Affectiv-ity and Marital Satisfaction: The Importance of Actor and Partner Anger. J Res Pers, 44 (3), 328-334. https://doi.org/i0.i0i6/j.jrp.20i0.03.005

R0ysamb, E., Nes, R. B., Czajkowski, N. O. & Vassend, O. (20i8). Genetics, personality and wellbeing. A twin study of traits, facets and life satisfaction. Scientific Reports, 8 (i), i2298. https://doi.org/i0.i038/s4i598-0i8-2988i-x

Citación/referenciación: Abal, F., Lozzia, G. & Attorresi , H. (2021). Propiedades psicométri-cas de una escala de Depresión basada en el Modelo de los Cinco Factores. Psicología desde el Caribe,38(3), 300-322.

Samejima, F. (20i6). Graded response models. In W. J. van der Linden (Ed.), Handbook of Item Response Theory, vol. I (pp. i23-i36). Boca Raton: Chapman and Hall/CRC.

Sánchez, R. O. & Ledesma, R. D. (2009). Análisis psicométrico del Inventario de Síntomas Revisado (SCL-90-R) en población clínica. Revista Argentina de Clínica Psicológica, XVIII, 265-274. Recuperado de: https://www.redalyc.org/pdf/28i9/28i92i775007.pdf

Saucier, G. (2002). Orthogonal markers for orthogonal factors: The case of the big five. Journal of Research in Personality, 36 (i), i - 3i. https://doi.org/i0.i006/jrpe.200i.2335

Schimmack, U., Oishi, S., Furr, R. M. & Funder, D. C. (2004). Personality and life satisfaction: a facet-level analysis. Pers Soc Psychol Bull, 30 (8), i062-i075. https://doi.org/i0.ii77/0i46i67204264292

Siegler, I. C. & Brummett, B. H. (2000). Associations Among NEO Personality Assessments and Weil-Being at Midlife: Facet-Level Analyses. Psychol Aging, 15 (4), 7i0-7i4. https://doi.org/i0.i037/0882-7974.i5.4.7i

Simms, E. E. (2009). Assessment of the facets of the five factor model: Further development and validation of a new personality measure. (Tesis doctoral inédita). Universidad de Iowa. Iowa City.

Soto, C. J. & John, O. P. (20i6). The Next Big Five Inventory (BFI2): Developing and Assessing a Hierarchical Model With i5 Facets to Enhance Bandwidth, Fidelity, and Predictive Power. Journal of Personality and Social Psychology, 110 (3), i27. http://dx.doi.org/i0.i037/pspp0000096.

Spielberger, C. D., Agudelo, D., & Buela-Casal, G. (2008). Inventario de Depresión Estado/ Rasgo (IDER). Madrid: TEA Ediciones.

Squillace, M., Picón Janeiro, J., & Schmidt, V. (20i3). Adaptación local del Cuestionario Revisado de Personalidad de Eysenck. Evaluar, 13, i9-37. https://doi.org/i0.35670/i667-4545.vi3.ni.6794

Stark, S., Chernyshenko, O.S., Drasgow, F. & White, L.A. (20i2). Adaptive testing with multidimensional pairwise preference items: Improving the efficiency of personality and other noncognitive assessments. Organizational Research Methods, 15, 463-487. https://doi.org/i0.ii77/i094428ii24446ii

Steel, P., Schmidt, J., Bosco, F. A. & Uggerslev, K. L. (20i9). The effects of personality on job satisfaction and life satisfaction: A meta-analytic investigation accounting for bandwidth-fidelity and commensurability. Human Relations, 72 (2), 2^-247. https://doi.org/i0.ii77/00i87267i877i465

Tackett, J. L. & Lahey, B. B. (20i7). Neuroticism. In T. A. Widiger (Ed.), The Oxford handbook of the five factor model. New York: Oxford University Press.

Taylor, N. & De Bruin, G. P. (2006). BTI. Manual of the Basic Traits Inventory. Johannesbur-go. Sudáfrica: JvR.

Timmerman, M. E. & Lorenzo-Seva, U. (20ii). Dimensionality assessment of ordered polytomous items with parallel analysis. Psychological Methods, 16 (2), 209-220. http://dx.doi.org/i0.i037/a0023353.

Verduyn, P., Résibois, M. & Massar, K. (20i7). Sadness. In V. Zeigler-Hill & T. K. Shackelford (Eds.), Encyclopedia of personality and individual differences. New York: Springer

Watson, D., Nus, E. & Wu, K. D. (20i7). Development and Validation of the Faceted Inventory of the Five-Factor Model (FI-FFM). Assessment, i-28. https://doi.org/i0.ii77/i073i9iii77ii022

Widiger, T. A. (2009). Neuroticism. In M. R. Leary & R. H. Hoyle (Ed.), Handbook of individual differences in social behavior (pp. i29-i46). New York: Guilford Press.

Wierzbicka, A. (i999). Emotions across languages and cultures: Diversity and universals. Cambridge. UK: Cambridge University Press.

Xi, C., Zhong, M., Lei, X., Liu, Y., Ling, Y., Zhu, X., Yao, S. & Yi, Ji. (20i8). Psychometric Properties of the Chinese Version of the Neuroticism Subscale of the NEO-PI. Front Psychol, 9 (i454). https://doi.org/i0.3389/fpsyg.20i8.0i454