53 Antonio Pamies DOI: 10.4312/linguistica.62.1-2.53-78 Universidad de Granada antonio.pamies@gmail.com José Manuel Pazos Universidad de Granada jmpazos@ugr.es ENTRE EL BINOMIO FRASEOLÓGICO, LA COLOCACIÓN COMPLEJA Y LA COLOSTRUCCIÓN: UN EXAMEN «LARGO Y TENDIDO» 1 INTRODUCCIÓN La existencia de una transición gradual entre la sintaxis y el léxico (Langacker 1987; Kay/Michaelis 2012; Michaelis 2019) no cuestiona la existencia de los prototipos más extremos, tanto de las combinaciones «libres» (open choice principle) como de la fija- ción fraseológica (idiom principle), solo pone en duda que dichas figuras se autoexclu- yan de manera discreta. Es obvio que comer patatas o beber agua son sintagmas verba- les, mientras que «marear la perdiz y pelar la pava son locuciones, porque, en ellas, la relación predicado-argumento no se actualiza cada vez que un hablante emplea dichas expresiones, sino que se encuentra petrificada» (Osorio Olave 2012: 113). En cambio, la ubicación exacta de otras secuencias multilexicales en dicha transición es más bo- rrosa, no sólo para las colocaciones, sino para los phrasal verbs, las comparaciones estereotipadas y los esquemas fraseológicos (cf. Dobrovol’skij 2007; Pamies 2019; Me- llado 2020; Pamies/Wang 2020). También provocan discrepancias las secuencias inter- namente fijas pero variables en la conexión con su contexto discursivo inmediato. Por ejemplo, el Diccionario combinatorio del español contemporáneo de Ignacio Bosque (2001) estipula que a bombo y platillo es una locución adverbial, pero añade que, en el discurso, sólo se combina con una cuarentena de verbos, que pertenecen a determinadas clases léxicas (2001: 26). En el caso de a bombo y platillo su colocabilidad exigiría: a) verbos que denotan difusión o transmisión de información (p.ej., proclamar, anunciar, señalar, remachar); b) verbos que designan la puesta en marcha de algo (organizar, estrenar); c) verbos que denotan elogio o conmemoración de algo (celebrar, aclamar…); d) verbos que designan transacciones económicas (contratar, venderse) ([r edes ] 2004). Cabe entonces preguntarse si anunciar a bombo y platillo es una unidad fraseoló- gica o si, por el contrario, es una combinación libre entre un frasema adverbial y un verbo totalmente ajeno a la expresión (cf. Corpas 1996: 119). En cambio, el mismo Linguistica_2022_2_FINAL.indd 53 Linguistica_2022_2_FINAL.indd 53 5. 01. 2023 07:29:06 5. 01. 2023 07:29:06 54 diccionario sólo cita tres verbos para a tocateja, que son pagar, comprar y abonar. Esta secuencia no presenta diferencias gramaticales «internas» con a bombo y platillo pero parece sufrir mayores restricciones con respecto a su entorno sintagmático. Si las pala- bras pueden sufrir fijación con sus vecinas formando frasemas, este fenómeno también puede afectar al frasema en su conjunto, y su inserción en su contorno puede a su vez sufrir una fijación secundaria. Es el caso de lo que Koike (2001, 2012) y García-Page (2011) llaman colocación compleja, y que nos devuelve a la eterna pregunta de ¿dónde empieza la fraseología? (cf. Colson 2015). Hablar de colocación implica, por defini- ción, manejar datos cuantitativos (Firth 1957; Sinclair et al. 1970; Alonso Ramos 1994- 1995), por ello, para «pescar» colocaciones en un corpus, se suelen emplear algoritmos estadísticos basados en el análisis frecuencial (Halliday 1961: 276). El presente trabajo intenta invertir el mecanismo: partimos de una expresión previamente etiquetada como frasema, la locución adverbial largo y tendido, y estudiamos su comportamiento fre- cuencial y sintáctico-semántico en un corpus textual de grandes dimensiones. De esta manera, los datos lingüísticos están en el punto de partida y los comportamientos fre- cuenciales son la incógnita que debería confirmarlos. 1.1 Precisiones terminológicas Los fraseólogos llaman binomios a las combinaciones fijas que están formadas por dos palabras (y sus eventuales clíticos), sean yuxtapuestas o coordinadas. Su sentido literal suele ser redundante (nunca jamás; al fin y al cabo; sin causa ni razón, dueño y señor) o antitético (a diestra y siniestra; día y noche; más o menos, de quita y pon, tarde o temprano) (cf. García-Page 1998, 2008: 329-333). Dichas unidades son transversales a varias subclases fraseológicas (Čermák 2007: 414-429), y su fijación las hace interna- mente irreversibles; prueba de ello es que su traducción a otra lengua, aunque tenga los mismos componentes, puede a veces colocarlos en orden inverso (p.ej. el binomio ing. black and white y fr. noir et blanc se traduce por esp. blanco y negro). Siguiendo a Corpas, el binomio se puede considerar como una subclase de la locución (1996: 96-112), ya sea nominal: flor y nata; santo y seña; el oro y el moro (p. 96), adjetiva: mondo y lirondo; sano y salvo; de carne y hueso (1996: 98), verbal: ir y venir; coser y cantar; nadar y guardar la ropa (1996: 102) o adverbial cara a cara; poco a poco (1996: 111), categoría en la cual precisamente incluye esta autora largo y tendido (1996: 102). Sin embargo, dada su elevada coocurrencia con hablar, se podría sospechar que largo y tendido fuese, a su vez, componente de una unidad fraseológica mayor. De hecho, la propia autora advierte que, cuando una locución coocurre a menudo con una misma palabra es difícil decidir si ésta es un elemento de la locución (1996: 119), citando ejemplos como cumplir a rajatabla y dinero contante y sonante 1 . Los pioneros de la lingüística computacional llamaron collocations a todas las coo- currencias léxicas cuya frecuencia estadística fuera superior a su cálculo normal de probabilidades (Firth 1957; Sinclair 1970, 1991). Sin embargo, tal definición parece 1 Véase también al respecto Írsula Peña (1994: 27-34), Corpas (2001: 91) y Bustos Plaza (2005). Linguistica_2022_2_FINAL.indd 54 Linguistica_2022_2_FINAL.indd 54 5. 01. 2023 07:29:06 5. 01. 2023 07:29:06 55 demasiado vaga, porque no establece límites sistémicos con todas las combinaciones libres frecuentes ([Redes ] 2001: XXII), ni tampoco con respecto a frasemas de otras subclases. El término inglés collocation, para esta escuela, era prácticamente un hiperó- nimo equivalente a lo que hoy llamaríamos frasema. Otros enfoques, especialmente en la Europa continental, defienden una visión más restrictiva de la colocación, entendida como una subclase fraseológica bien delimitada por su forma y su función: […] unidades fraseológicas formadas por dos unidades léxicas en relación sin- táctica, que no constituyen, por sí mismas, actos de habla ni enunciados; y que, debido a su fijación en la norma, presentan restricciones de combinación estable- cidas por el uso, generalmente de base semántica: el colocado autónomo semánti- camente (la base) no sólo determina la elección del colocativo, sino que, además, selecciona en éste una acepción especial, frecuentemente de carácter abstracto o figurativo. (Corpas Pastor 1996: 66); […] word combinations in which some substitution is possible, but with some arbitrary limitations on substitution; in which at least one element has a non-li- teral meaning, and at least one element is used in its literal sense; and the whole combination is transparent (Gouverneur 2008: 232). Muchos especialistas prefieren hoy usar multi-word expressions (MWE) como hi- perónimo fraseológico general (p. ej., Colson 2019), dejando a collocation este sentido más restringido (cf. Mel’čuk 1998, 2003, 2013; Hausmann 1979, 1998; Alonso Ramos 1994-95; Čermák 2007; Grossmann/Tutin 2003; Pamies 2017) 2 , incluso criticando ex- plícitamente el criterio frecuencial (p. ej. Bosque 2001), aunque quienes mantienen una postura más ortodoxamente sinclairiana siguen empleando collocation en su sentido amplio (cf. Alonso/Williams/DeCesaris 2019). 1.2 Largo y tendido La expresión largo y tendido no figuraba en los primeros diccionarios generales «clá- sicos» ([COV] 1611, [AUT] 1726-1739, [TERR] 1786), aunque sí lo hacía en una de las obras pioneras de la fraseografía hispana, el Vocabulario de frases y refranes de Gonzalo Correas ([COR] 1627), que, aunque no la definía, citaba ejemplos de uso. La lexicografía general, que la define hoy como ‘extensamente’ y ‘sin prisa’, la vincula a un contexto verbal restringido: hablar/escribir~ (DLE 2021) 3 . La fraseografía moderna la define vinculándola siempre a unos contextos específicos. P. ej., ‘con profusión’ [ha- blar ~] ([DEC] 1997), ‘extensamente’ [hablar o escribir ~] ([DFDL] 2004), ‘durante mucho tiempo’ [escribir, explicarse, explayarse, hablar ~] ([DFE] 2007). Dado que 2 La teoría de las funciones léxicas emplea criterios cualitativos, al afirmar que la colocación une elementos con funciones distintas: la base (generalmente literal), selecciona el colocado (general- mente metafórico), que le aporta, de manera sistemática, una modificación semántica específica (Mel’čuk 1998, 2003, 2013). Para el español, véase Alonso Ramos (2002). 3 [DLE] https://dle.rae.es/largo?m=form (consulta 06/02/2021). Linguistica_2022_2_FINAL.indd 55 Linguistica_2022_2_FINAL.indd 55 5. 01. 2023 07:29:07 5. 01. 2023 07:29:07 56 estos diccionarios no siempre describen con precisión los contextos, es de suponer que conceden a estos casos particulares una representatividad elevada. Sin embargo, existe bastante variación de un diccionario a otro en la selección de dichos verbos, los que ci- taba Correas eran (curiosamente) mentir, dormir, pasear, jugar y comer ([COR] 1627). Como se ha dicho, algunos fraseólogos consideran que una locución adverbial que se combina asiduamente con un mismo verbo (llorar a moco tendido / llorar a lágri- ma viva) constituye una subcategoría especial, que Koike (2001, 2012) y García-Page (2011) llaman colocación compleja. Este fenómeno también se podría considerar como un hecho (micro)sintáctico: la imbricación de un fraseologismo dentro de otro (Pamies 2013, 2017) 4 . Son muchas las locuciones adverbiales que se integran dentro de una colocación, dando lugar a una unidad de segundo nivel, donde hacen de colocativo y aportan diversas funciones léxicas a su verbo base: a mandíbula batiente, a pierna suelta, de buena tinta (cf. Blanco 2001: 175). Es más, en principio, nada parece impedir que cualquier locución adverbial pueda imbricarse dentro de un frasema mayor, no sólo con un verbo sino incluso con otro frasema, sola- pándose o interrumpiéndolo, como se ha comprobado en muchos ejemplos de nuestro corpus (Fig.1). …yo podría hablar largo y tendido de este tema …la nueva controversia que traba el Senado da para largo y tendido …los estatutos del mismo tendrán que ser aprobados por todos los municipios, lo que va para largo y tendido …le dio largo y tendido a la cháchara... Figura 1. Imbricación entre frasemas 4 P. ej. una locución dentro de una paremia. Linguistica_2022_2_FINAL.indd 56 Linguistica_2022_2_FINAL.indd 56 5. 01. 2023 07:29:07 5. 01. 2023 07:29:07 57 En estos casos, la expresión es doblemente idiomática: «internamente» y «externa- mente». Para distinguir una colocación compleja de la combinatoria libre que incluye una colocación, Xavier Blanco propone el criterio siguiente: la locución a mares for- maría una colocación compleja con llover, sudar y llorar, porque sólo modifi ca estos verbos, a diferencia de a mansalva, que modifi ca muchos verbos (2001: 175). Para estudiar en detalle esta cuestión, hemos realizado una serie de búsquedas en el corpus Spanish Web (EsTenTen11_Eu+Am) 2011 [ETT], que contiene casi 9500 millones de palabras (cf. Jakubiček et al. 2013, Kilgarriff /Renau 2013), accesible a través de la plataforma Sketchengine ([SKE] 2021) 5 . 2 EXPERIMENTO Y RESULTADOS 2.1 V + Loc. Adv Mediante la opción Concordancia > CQL, obtenemos un listado inicial de 3542 ocu- rrencias de largo y tendido 6 , que sometemos a un examen «manual» para observar su contexto inmediato, sin ningún fi ltro previo que pudiera sesgar los resultados. Para estudiar la relación entre este colocativo y su base, descartamos de este output las se- cuencias cuya frecuencia de coocurrencia es inferior a 5, que podrían ser casuales o irrelevantes, en la medida en que, en un corpus tan inmenso, incumplirían por ello una característica estadística básica para cualquier tipo de frasema. Al examinar los verbos, salta a la vista el predominio de la asociación con hablar, que, en posición antepuesta y continua, aparece en 1578 coocurrencias de la locución 7 (del tema de las reservas de los restaurantes hemos hablado largo y tendido en los últimos meses). Pero también aparecen otros contextos verbales que justifi can un análisis cuantita- tivo más detallado. En primer lugar, abundan los sinónimos de hablar asociados a esta locución (con 556 coocurrencias por encima del umbral): Tabla 1. Sinonimia verbal recurrente con la locución hablar 1578 charlar 218 conversar 175 platicar 163 total 2134 5 Aunque el colocativo es seleccionado por la base, para la práctica lexicográfi ca resulta más efi caz partir del colocativo (Bosque 2019: 19-20), sobre todo cuando éste es a su vez un frasema en sí mismo. 6 Concordancia CQL [word=“largo“] [word=“y“] [word=“tendido“]. 7 Concordancia CQL [lemma=“hablar“] [word=“largo“] [word=“y“] [word=“tendido“]. Linguistica_2022_2_FINAL.indd 57 Linguistica_2022_2_FINAL.indd 57 5. 01. 2023 07:29:07 5. 01. 2023 07:29:07 58 El binomio largo y tendido también coocurre con hipónimos de hablar, que perte- necen igualmente a la clase semántica de los «verbos discursivos», o verba dicenda, que designan actos comunicativos (incluido escribir). De hecho, el diccionario com- binatorio de Ignacio Bosque, que apenas trata esta expresión, observa aun así que, además de hablar, el binomio coocurre también con otros verbos de lengua [Redes 2004: 1253]. Estos hipónimos aportan otros 470 casos que superan el filtro frecuen- cial f ≥ 5. Tabla 2. Hiponimia verbal recurrente con la locución discutir 126 chacharear 9 despachar 7 debatir 90 analizar 9 entrevistar 6 escribir 68 discurrir 5 responder 6 dialogar 51 tratar 7 disertar 5 comentar 25 extenderse 7 exponer 5 explicar 21 contar 7 departir 9 opinar 7 total 470 A ello deben sumarse las formas discontinuas con el verbo separado o pospuesto con respecto al binomio. Lanzamos otras búsquedas ad hoc para estos verbos y en- contramos 5 formas invertidas (todas con hablar) y 282 discontinuadas para el total de verbos que satisfacen el umbral f ≥ 5 y con una ventana de 1 a 4 palabras 8 (Tablas 3 a 5). Tabla 3. Coocurrencias invertidas y discontinuas con hablar LOC + V hablar 5 V hablar LOC 188 total 193 Tabla 4. Coocurrencias discontinuas con sinónimos de hablar conversar 22 charlar 14 platicar 12 total 48 8 [lemma=“hablar“] [ ]{1,4} [word=“largo“] [word=“y“] [word=“tendido“], etc. Linguistica_2022_2_FINAL.indd 58 Linguistica_2022_2_FINAL.indd 58 5. 01. 2023 07:29:07 5. 01. 2023 07:29:07 59 Tabla 5. Coocurrencias discontinuas con hipónimos de hablar discutir 10 debatir 11 tratar 7 escribir 7 explicar 6 dialogar 5 total 46 …del que otro día más largo y tendido hablaremos …hablaremos del aborto largo y tendido otro día …charlamos sobre el tema, largo y tendido …quienes los vieron platicar dicen que lo hicieron largo y tendido Sumando todos los verbos discursivos, independientemente de su posición con res- pecto al binomio, se obtienen 2939 ítems (tabla 6). Tabla 6. Sumas de variantes continuas, invertidas y discontinuas contin invert discontin totales con hablar 1578 5 188 1771 con sinónimos 604 0 48 652 con hipónimos 470 0 46 516 totales 2652 5 282 2939 Aparte de este grupo, se observa otro formado por verbos «de pensamiento» (pensar o hipónimos: reflexionar, meditar, especular, considerar, teorizar, filosofar…), en 73 co-ocurrencias con largo y tendido (Tabla 7). Tabla 7. Coocurrencias con verbos de pensamiento v pensam . + LOC Adv largo y tendido f≥5 pensar 40 reflexionar 16 meditar 12 saber 5 total 73 Linguistica_2022_2_FINAL.indd 59 Linguistica_2022_2_FINAL.indd 59 5. 01. 2023 07:29:08 5. 01. 2023 07:29:08 60 …me he permitido el lujo de pensar largo y tendido en ambos temas. …recuerdo que lo meditaste largo y tendido y, de repente, te lanzaste Merece comentario aparte el caso del verbo saber, pues cuando se asocia a largo y tendido ya no es para significar «durante mucho tiempo» sino simplemente 9 «mucho»: …como un zorro viejo que de trabajo táctico sabe largo y tendido 10 Además de estas dos clases semánticas (verbos discursivos y verbos de pensa - miento), aparecen otros verbos, semánticamente ecléticos y con frecuencias casi siempre muy bajas, formando en principio combinaciones libres, en las que el ha - blante selecciona el verbo por un lado y la locución adverbial por otro, y las junta de manera imprevisible: trabajar, laburar, descansar, sentarse, esperar, bostezar, dormir, viajar, caminar, avanzar, seguir, proseguir, detenerse, entretenerse, esca- lar, caer, sonar, escuchar, atender, ocuparse, participar, probar, compartir, mos - trar, ver, mirar, buscar, investigar, hurgar, leer, batallar, pelear, batir, ganar, cortar, gastar, rugir, putear, gobernar, ejercer (el poder), llorar, suspirar, reír, aplaudir, abrazarse, besar, disfrutar, jugar, bailar, silbar, tocar, chupar, feste - jar, almorzar, desayunar, cocinar, matear, dar para, ser, estar, haber, coexistir, moquear 11 : …se cubrió el rostro y lloró largo y tendido …el jugador balcánico batalló largo y tendido para eliminar al checo …hay administraciones que en la práctica han gobernado largo y tendido; y ni así aprenden …los Python de hecho se rieron largo y tendido de mendigos y viejos y enfermos y homosexuales. Estos contextos suman 97 coocurrencias que alcanzan el umbral f≥5 (Tabla 8), mu- chos otros verbos son en cambio descartados porque sólo coocurren una vez con largo y tendido. 9 Acerca de la polisemia fraseológica en general, véase Mellado (2014). 10 http://www.futbolprimera.es [21/11/2008] (apud. [ETT]). 11 Recuérdese que Correas (1627) citaba también dormir y mentir (cf. supra). Éste último, aun de- signando un acto de habla, no aparece ni una sola vez en el corpus moderno, pese a las enormes dimensiones del mismo. Linguistica_2022_2_FINAL.indd 60 Linguistica_2022_2_FINAL.indd 60 5. 01. 2023 07:29:08 5. 01. 2023 07:29:08 61 Tabla 8. Coocurrencias con otros verbos con otros verbos (f≥5) festejar 10 disfrutar 7 mirar 6 dar para 9 suspirar 7 seguir 6 leer 8 besar 6 batallar 5 dormir 8 llorar 6 esperar 5 trabajar 8 escuchar 6 total 97 Si sumamos todas las coocurrencias entre un verbo y la locución largo y tendido que igualen o superen el umbral, la cifra obtenida es de 3109 (Tabla 9). Tabla 9. Coocurrencias entre un verbo y la locución por encima del umbral v + loc largo y tendido f ≥ 5 con verbos discursivos 2939 con verbos de pensamiento 73 con otros verbos 97 total 3109 2.2 N + LOC Adj Al examinar los usos restantes, nos encontramos con un fenómeno curioso que no se menciona en los diccionarios (quizás por considerarse como preceptivamente incorrec- to) pero cuya productividad se manifiesta de manera indiscutible en el corpus: largo y tendido puede aparecer con función adjetiva y con el significado de «muy largo» (en sentido temporal o espacial), con sustantivos diversos. Hicimos una búsqueda automá- tica, obteniendo 161 resultados, aunque, al examinarlos uno por uno, se comprueba que muchos de ellos eran falsos positivos, porque el sustantivo era simplemente un com- plemento verbal intercalado entre el verbo y la locución adverbial, dentro una variante discontinua 12 . Eliminamos manualmente estos casos (que ya habían sido contabilizados antes), reduciéndose la lista a 52 ejemplos, donde largo y tendido modifica un sustan- tivo en vez de un verbo: …después de un almuerzo largo y tendido, había que bajar lo comido con un sabroso y oscuro café turco 13 … …os recomiendo un vistazo largo y tendido a su página web 14 …Haití, destruido por un terremoto largo y tendido 15 … 12 P. ej. nos habló largo y tendido de todo ello (www.coar.es) (apud. [ETT]). 13 http://www.labuenavida.cl (apud. [ETT]). 14 http://fcom.us.es (apud. [ETT]). 15 http://www.conaleche.gob.do (apud. [ETT]). Linguistica_2022_2_FINAL.indd 61 Linguistica_2022_2_FINAL.indd 61 5. 01. 2023 07:29:08 5. 01. 2023 07:29:08 62 Dada la existencia de esta transcategorización en locución adjetiva, hemos supuesto que, por la misma razón, también debía haber formas flexionadas en género y/o nú- mero. Hicimos una búsqueda a tal efecto y aparecieron 18 variantes en plural, 83 en femenino singular y 17 en femenino plural, o sea, 118 formas adjetivas flexionadas, lo que eleva el total de epítetos a 170. …realizar una larga y tendida lista de gestiones burocráticas 16 …unos trámites de divorcio largos y tendidos 17 …a pesar de las veladas largas y tendidas, acompañadas de vinito tinto 18 Estos casos flexionados no se habían contabilizado antes, puesto que nuestra búsqueda inicial no lematizaba una forma que, al presuponerse adverbial, creíamos invariable por definición. Por si fuera poco, 29 de estos empleos adjetivales están en función de atributo (separados del sustantivo por un verbo copulativo) 19 , lo cual confirma la productividad de este uso adjetival. Las variantes adjetivales aportan conjuntamente 118 ocurrencias más de la locución, alterando el total inicial, que ya no sería de 3542 sino de 3660. …el debate alrededor de estos conceptos sería largo y tendido …el apagón también fue largo y tendido Dichas variantes (tanto epítetos como atributos) aparecen con sustantivos muy di- versos, a veces de manera un tanto extraña (como un coche con un capó largo y ten- dido). La mayoría forma combinaciones libres, apareciendo sólo una vez, pero si nos fijamos exclusivamente en las 70 ocurrencias que alcanzan o superan el umbral, vemos que éstas se concentran en un grupo muy reducido de sustantivos, que se refieren todos a actos de habla o comunicación, con un llamativo paralelismo con el grupo antes cita- do de los verbos discursivos (Tabla 10). Tabla 10. Coocurrencias entre sustantivos y variantes adjetivas de la locución N + LOC Adj (f≥5) conversación(es) 21 charla(s) 20 debate 12 tema 10 plática 7 total 70 16 http://www.aulamagna.com.es (apud. [ETT]). 17 http://www.divorcios-express.com.mx (apud. [ETT]). 18 El Colombiano http://www.elcolombiano.com.co (apud. [ETT]). 19 26 casos con ser, 3 con estar, ninguno con parecer o semejar. Con estar hemos descartado manual- mente los casos en que es auxiliar de otro verbo en gerundio. Linguistica_2022_2_FINAL.indd 62 Linguistica_2022_2_FINAL.indd 62 5. 01. 2023 07:29:08 5. 01. 2023 07:29:08 63 Sumando las secuencias adverbiales y adjetivales, y considerando como posibles colocaciones complejas todas las que igualen o superen el umbral f ≥ 5, el total alcan- zaría los 3179 candidatos (Tabla 11). Tabla 11. Posibles colocaciones complejas posibles colocaciones complejas (f ≥ 5) V + LOC Adv largo y tendido 3109 N + LOC Adv largo y tendido 70 total 3179 Si a la cifra total de apariciones de largo y tendido (3660) le restamos estos 3179 ejemplos (86,9 %) quedarían 481 casos (13,1 %) que, por su frecuencia, no pueden ser candidatos, y, por lo tanto, no es descartable que constituyan combinaciones libres (Fig. 2). Figura 2. Proporción de coocurrencias de largo y tendido en el corpus 3 DISCUSIÓN 3.1 Aspectos cuantitativos Según nuestros resultados en bruto, el binomio largo y tendido aparecería mayoritaria- mente como parte de unas colocaciones complejas, frente a una minoría de empleos en los que se combina con su núcleo de forma libre e imprevisible. Si las colocaciones se caracterizan por tener una mayor concordancia semántica o fuerza de atracción entre sus miembros (Apresjan 2009), ello debería reflejarse de alguna manera en las frecuen- cias absolutas de coocurrencia, pero un umbral mínimo quizá no sea una condición suficiente (aunque sí necesaria), sobre todo teniendo en cuenta que éste se fija de una manera relativamente arbitraria. Linguistica_2022_2_FINAL.indd 63 Linguistica_2022_2_FINAL.indd 63 5. 01. 2023 07:29:08 5. 01. 2023 07:29:08 64 En principio, un cálculo preciso debería basarse en datos relativos y probabilísticos, puesto que la colocación se define como «dos palabras que coocurren más a menudo de lo que sus frecuencias respectivas y la longitud del texto permiten predecir» 20 (Sinclair/ Jones/Daley 1970: 10) 21 . Obviamente, tales cálculos no serían necesarios para identi- ficar una colocación con 1771 ocurrencias, como hablar + largo y tendido, pero las frecuencias más moderadas requieren mediciones precisas. Se utilizarán por ello varias medidas estadísticas que se describen más adelante. Se han propuesto diversas medidas estadísticas para indicar la atracción mutua que ejercen sobre sí los componentes de la colocación. Sin embargo, un tratamiento exclusivamente estadístico no basta para de- tectar colocaciones en corpus no filtrados: lo que extrae son candidatos que deberán ser comprobados individualmente a posteriori para acabar de deslindar las combinaciones libres de las colocaciones. Aquí, invertimos el sistema en cierto modo, puesto que apli- camos la estadística un listado de combinaciones previamente seleccionadas y cuyos datos de frecuencias se han obtenido después «manualmente». Calculamos 9 medidas estadísticas: Información Mutua (IM), IM2, IM3, z-score, t-score, log likelihood, Log Dice, Log Ratio y μ. Información Mutua (IM) proporciona una indicación de la relevancia de la colo- cación. Obtiene valores más altos en casos de combinaciones exclusivas (A y B tien- den a aparecer siempre juntos) independientemente de cuántas veces coocurran. Puede interpretarse como un indicador de la exclusividad de esa colocación (Brezina 2018: 70). Esa falta de relevancia de la frecuencia de coocurrencia en la IM la convierte en un buen indicador de la independencia de A y B, al destacar las combinaciones de palabras con bajas frecuencias frente a las de altas frecuencias de aparición. Es, en otra reformulación, la reducción en la incertidumbre sobre la ocurrencia de una palabra cuando aparece otra (Manning/Schütze 1999: 183). IM2 y MI3 son variantes heurísticas de la información mutua (IM) que intentan paliar el efecto amplificador de IM en el caso de colocaciones con componentes de reducida frecuencia individual. T-score es un indicador de lo fortuita que es una combinación AB: a mayores valores de t-score, menor es la probabilidad de que se trate de una combinación aleatoria. Las críticas que recibe el uso de esta medida es que asume una distribución normal de las probabilidades (Manning/Schütze 1999: 169). Z-score es el número de desviaciones estándar de la frecuencia media. Compara la frecuencia observada con la esperada. Log Likelihood es una medida que intenta solucionar los problemas asociados a IM y t-score. Compara la probabilidad bajo, la hipótesis nula, de obtener los valores obser- vados con la probabilidad en el caso de que exista dependencia entre los constituyentes de la combinación. El Coeficiente de Dice es conceptualmente similar a la información mutua, mejora las limitaciones de ésta y es considerada como una de las medidas de asociación más eficaces para detectar colocaciones (Rychlý 2008; Kolesnikova 2016: 340). Rychlý elabora una transformación del coeficiente de Dice que resulta más fácil 20 Traducción nuestra. 21 De la definición estadística de colocación se puede deducir su definición distribucional por inver - sión del razonamiento: «las colocaciones de determinada palabra son enunciados de los lugares habituales o convencionales que ocupa esa palabra». Linguistica_2022_2_FINAL.indd 64 Linguistica_2022_2_FINAL.indd 64 5. 01. 2023 07:29:08 5. 01. 2023 07:29:08 65 de interpretar intuitivamente: Log Dice. En cuanto a Log Ratio, es una medida heurís- tica también conceptualmente similar a la información mutua (IM) creada para facilitar su interpretación intuitiva. Cada punto adicional de Log Ratio equivale al doble de la diferencia entre la frecuencia del colocativo junto a la base y su frecuencia en otras posiciones (Hardie 2014). Finalmente, μ es la razón geométrica de la frecuencia real y la frecuencia esperada. Las medidas estadísticas que hemos descrito pueden clasificarse en función de dos dimensiones: lingüística y estadística. La dimensión lingüística denota la unicidad (fuerza o estabilidad de la unidad); la dimensión estadística puede analizar el grado de asociación, la significancia (relevancia) de la asociación y la heurística (si esa medida se utiliza ad hoc por resultar intuitiva u operativa, sin estar necesariamente bien funda- mentada desde el punto de vista teórico) (Pazienza et al. 2005). Mostramos esto en la Tabla 12, adaptada de Pazienza et al. (Ibid.: 260). Tabla 12. Dimensiones de las medidas Dim. Lingüística Dimensión Estadística Grado de Asociación Significancia Asoc. Heurística Unicidad IM Dice z-score t-score Log Likelihood IM2 IM3 Log Ratio Frecuencia Coocurrencia Es posible, además, clasificar estas medidas desde otras dos dimensiones adiciona- les, situándolas en un sistema de referencia constituido por la exclusividad de la com- binación (eje de ordenadas) y la frecuencia de la unidad (eje de abscisas), tal como se muestra en el siguiente gráfico adaptado de Brezina (2018: 74) (Fig. 3). Estos marcadores estadísticos miden la relación entre las frecuencias absoluta de las secuencias, la frecuencia individual de sus componentes y el tamaño de corpus (medido en tokens y en types), para un corpus de 9.497.213.009 palabras (que, una vez lematiza- das y contadas una sola vez cada una, suman 19.469.130), y para una frecuencia global de 3660 ocurrencias de largo y tendido. Linguistica_2022_2_FINAL.indd 65 Linguistica_2022_2_FINAL.indd 65 5. 01. 2023 07:29:08 5. 01. 2023 07:29:08 66 Figura 3. Clasifi cación de las medidas por las dimensiones de exclusividad y frecuencia 3.2 Aspectos lingüísticos El hecho de que un colocativo coocurra también con los sinónimos e hipónimos de su base contradice en principio la defi nición Firthiana de colocación, puesto que con- torno semántico-sintáctico del colocativo tiende a ser «heredado» por sus sinónimos e hipónimos (cf. Nazar/Renau 2019). Sin embargo, desde el punto de vista de las funciones léxicas, resultaría incluso lógico que el magnifi cador de una base también sirva para sus sinónimos e hipónimos. P.ej., la locución en voz alta puede formar colocación compleja con hablar, pero su colocativo es «heredado» por hipónimos de su base formando otras colocaciones: decir en voz alta / leer en voz alta, etc. (cf. Barrios 2009: 51-55). Esta extensión puede incluso ser metonímica. Alain Polguère habla de «trans- plante colocacional» (greff e collocationnelle) para referirse a «colocaciones cuyo colocativo parece ‘prestado’ por otra colocación, y cuya base suele ser semántica- mente cercana a la base a la que se injerta el colocativo prestado» (2007: 2) 22 . Así soleil de plomb (lit. *sol de plomo) puede reemplazarse por soleil insoutenable (lit. *sol inaguantable) por analogía con chaleur insoutenable (lit. *calor inaguantable) (2007: 11). En español, asumir el trono heredaría por analogía el colocativo asumir la responsabilidad, conceptualmente «cercano» a la base original (Uzcanga/Gómez 2009: 352). En las colocaciones complejas esta regla afectaría incluso a los derivados por nominalización (Blanco 2001: 177): 22 Traducción nuestra. Linguistica_2022_2_FINAL.indd 66 Linguistica_2022_2_FINAL.indd 66 5. 01. 2023 07:29:09 5. 01. 2023 07:29:09 67 votar > votación a mano alzada; asesinar > asesinato a sangre fría, trabajar > trabajo por cuenta propia. Sin embargo, como se ha dicho, dicha herencia también podría invocarse para negar que sean colocaciones, puesto que la sustitución sinonímica infringe la fi- jación y arbitrariedad teóricamente propia de las colocaciones (cf. Cserép 2017), la «concordancia semántica» de ciertos componentes los haría previsibles y hasta regulares (cf. Bosque 2019: 17). Pero la existencia de series fraseológicas ya era mencionada por el propio Bally (1905) desde los inicios de la teoría fraseológica. En lo que respecta al bloqueo sinonímico, es sin duda un rasgo de fijación, pero lo infringen también las locuciones con «variantes» (apostar / jugar a caballo gana- dor; meter la pata / la pezuña / la gamba ) sin que por ello se cuestione su carácter fraseológico. Parece que el bloqueo sinonímico afecta sólo al colocativo: dar un paseo no permite *regalar un paseo (echar la siesta > *tirar la siesta), tener miedo > *poseer miedo, romper a llorar > *quebrar a llorar; enemigo mortal > *enemigo letal; fumador empedernido > *fumador endurecido, etc.) (cf. Alonso, Geoffrey/ DeCesaris 2019:61). En cambio, la base suele infringir más fácilmente esta restric - ción (véase también Alonso Ramos 2019: 27, 34, 39). Se podría concluir que las colocaciones por imbricación son más proclives a la sustitución hiponímica de la base que las colocaciones «simples». P.ej., en disparar a bocajarro se puede reem- plazar el verbo por tirotear, ametrallar, acribillar, rematar, etc. [Redes 2001: 14]. Incluso puede ocurrir una sustitución del colocativo (ej. disparar a bocajarro > a quemarropa), pero cuando la sustitución de un colocativo produce una expresión totalmente sinónima, el resultado es una variante y no una nueva colocación. En cambio, cuando es la base lo que se sustituye, da lugar a otra colocación, porque el significado global se ve afectado. P. ej., en decir / plantear / expresar / soltar + a bocajarro, el colocativo implica (‘de improviso, inopinadamente’), y no ‘desde muy cerca’ como ocurre con disparar. Obsérvese que de improviso también es locución adverbial, pero no formaría colocación compleja porque puede combinarse con una lista abierta e impredecible de verbos (Penadés 2019: 88). No por ello las colocaciones dejan de ser unidades restringidas, almacenadas y recuperadas en el lexicón mental de los hablantes (Corpas 2019: 180), pero las colo - caciones por imbricación actúan en un nodo sintáctico superior, claramente descom- ponible, donde es toda la clase semántica del verbo base la que puede asociarse al mismo colocativo adverbial, por lo cual, la imbricación de un frasema en otro sería un hecho un poco más cercano al polo sintáctico del continuum construccional que al polo léxico. Linguistica_2022_2_FINAL.indd 67 Linguistica_2022_2_FINAL.indd 67 5. 01. 2023 07:29:09 5. 01. 2023 07:29:09 68 Figura 4. Conmutabilidad entre bases y entre colocativos Estos usos adjetivales se pueden considerar como una nominalización de la base verbal, ya que no parece casual que se den principalmente con sustantivos como con- versación (21 casos), charla (20), debate (12), plática (7), mientras que, entre los ver- bos que rigen su uso adverbial figuraban también conversar (175), charlar (218), de- batir (90), platicar (163). 4 CONCLUSIONES 4.1 Filtrando con un umbral absoluto de al menos 5 coocurrencias, se obtienen 3138 candidatos a colocación frente a 522 combinaciones libres. Tabla 13. Resumen del número y distribución de las ocurrencias de largo y tendido en el corpus Posibles colocaciones complejas LOC Adv + V. discursivo 2939 (80,3 %) LOC Adv + V. de pensamiento 73 (1,99 %) LOC Adv + V. de otra clase 97 (2,65 %) N + LOC. Adj 70 (1,91 %) Posibles combinaciones libres 481 (13,14 %) Total 3660 (100 %) 4.2 El análisis estadístico de los datos obtenidos del corpus confirma que todas las categorías satisfacen el requisito de coocurrencia mayor de la que podría esperarse por mera combinatoria libre (véase ANEXO). Sin embargo, las categorías [LOC Adv + V. de pensamiento], [N + LOC Adj] y [LOC Adv + V. de otra clase] obtienen siempre va- lores considerablemente menores a las de los verbos discursivos, «sólo» aparecen ≈ 40 veces más de lo que predice la combinatoria libre, ≈ 10 veces más en el caso de la cate- goría que incluye verbos de otra clase, y son las únicas que poseen valores negativos en Linguistica_2022_2_FINAL.indd 68 Linguistica_2022_2_FINAL.indd 68 5. 01. 2023 07:29:09 5. 01. 2023 07:29:09 69 el marcador Log Dice. En lo que coinciden todas las medidas, aun así, es en confirmar el carácter colocacional de la coocurrencia de la locución largo y tendido con hablar y con los verbos discursivos en general. En efecto, en el análisis hemos observado que el verbo base hablar es reemplazable por otros elementos de su misma clase semántica. Por otra parte, el estudio de corpus hace aparecer abundantes usos adjetivales de largo y tendido, sobre todo complementando sustantivos cuyo referente es un acto comunica- tivo (discusión, charla, conversación, diálogo…), por tanto, probables nominalizacio- nes de dichos verbos. Por analogía, también hay verbos de pensamiento que conmutan entre sí como base del colocativo largo y tendido. 4.3 El que la colocación compleja permita sustituciones sinonímicas, hiponímicas, e incluso nominalizaciones, indica que su grado de fijación es mucho menor que el de las colocaciones «simples». Como la secuencia puede cambiar su sentido global, no se trata tampoco de variantes (cf. García-Page 2008: 244), sino de construcciones semi-composicionales. Un fenómeno similar ha sido señalado por Pejović y Valožić (2021) a propósito de la expresión irse por los cerros de Úbeda. Estas autoras conclu- yen que la locución propiamente dicha se limita a «los cerros de Úbeda», mientras que el verbo de movimiento formaría con ella una construcción fraseológica: [V mov +Prep +los cerros de Úbeda]. Hay dos razones que apoyan esta tesis: (a) el uso real demuestra que dicho verbo es variable (b) según qué verbo aparezca (irse, salir, llegar, perderse, andar, estar, remontarse, desterrar), las equivalencias contextuales de traducción al serbio de la secuencia global cambian necesariamente. En las 68 ocurrencias del corpus que utilizan (sumando CREA y CORPES XXI) se observa que los verbos no son sinó- nimos, pero tienen cierta afinidad conceptual, por lo que Mellado considera que se trata de distintas formas léxicas (…) relacionadas entre sí de manera asociativa y creadas en virtud de un proceso de analogía (2020a: 30). 4.4 Por este rasgo, estas secuencias se parecen más bien a los esquemas fraseológi- cos (Mellado 2020, Mura 2012), estructuras semifijas y semicomposicionales hoy lla- madas colostrucciones (Stefanowitsh/Gries 2003), frasemas construccionales 23 (Booj 2013; Dobrovol’skij 2020) o construcciones fraseológicas (Mellado 2020b). La fronte- ra entre colocaciones y frasemas construccionales quizá no sea aquí lo esencial, puesto que la oposición entre ambos es gradual (Colson 2018), y, como dice Wulff (2013: 285), «effects of idiomatic variation are best observable in partially schematic complex constructions». Lo más importante es que los datos del corpus confirman, con datos cuantitativos precisos, que la fijación no es un rasgo tan formal como tradicionalmente se pensaba, sino una restricción de naturaleza conceptual, y por ello resulta permeable a la conmutación entre componentes semánticamente afines. Esta especie de «fijación semántica», que Colson (2018) llama entrenchment y Carmen Mellado fijación cog- nitiva, (2020a: 19), es fruto de una tensión dialéctica entre dos fuerzas contrarias: la automatización léxica (fijación formal) y la analogía conceptual (procesos productivos a partir de un modelo), «cuanto mayor es la fijación cognitiva, mayor tendencia a la variación, a la productividad y a la esquematicidad» (Mellado 2020a: 19). 23 «A constructional idiom is a (syntactic or morphological) schema in which at least one position is lexically fixed, and at least one position is variable » (Booij 2013: 258). Linguistica_2022_2_FINAL.indd 69 Linguistica_2022_2_FINAL.indd 69 5. 01. 2023 07:29:09 5. 01. 2023 07:29:09 70 Referencias bibliográficas ALONSO RAMOS, Margarita (1994-1995) «Hacia una definición del concepto de co- locación: de J. R. Firth a I. A. Mel’čuk». Revista de Lexicografía 1, 9-28. ALONSO RAMOS, Margarita (2002) «Explorando la frecuencia léxica para el Diccio- nario de colocaciones del español». En: T. E. Jiménez Juliá et al. (eds), Cum corde et in nova grammatica: Estudios ofrecidos a Guillermo Rojo. Santiago de Compos- tela: Universidad de Santiago, 19-40. ALONSO RAMOS, Margarita (2019) «Can collocations be deduced?». En: S. Tor- ner/E. Bernal, E. (eds), Collocations and Other Lexical Combinations in Spanish: Theoretical, Lexicographical and Applied Perspectives. London: Routledge, 21-40. ALONSO, Araceli/WILLIAMS, Geoffrey / DeCESARIS, Janet (2019) «Studying lexi- cal meaning in context: from collocation to collocational networks and resonance». En: S. Torner/E. Bernal, E. (eds), Collocations and Other Lexical Combinations in Spanish: Theoretical, Lexicographical and Applied Perspectives. London: Routle- dge, 41-74. APRESJAN, Juri (2009) «The theory of lexical functions. An update». En: D. Beck et al. (eds), Proceedings [of the] Fourth International Conference on Meaning-Text Theory. Montréal: Observatoire de linguistique Sens-Texte (OLST), 1-14. BALLY, Charles ( 3 1905 [1951]) Précis de stylistique. Esquisse d’une méthode fondée sur l’étude du français moderne. Genève: Eggimann. BARRIOS, María Auxiliadora (2009) «Domain, domain features of lexical functions, and generation of values by analogy according to the MTT approach». En: D. Beck et al. (eds), Proceedings [of the] Fourth International Conference on Meaning-Text Theory. Montréal: Observatoire de linguistique Sens-Texte (OLST), 45-53. BLANCO, Xavier (2001) «Regroupements sémantiques dans un dictionnaire d’adver- bes composes en espagnol». Lingvisticae Investigationes 24(2), 167-182. BOOIJ, Geerd (2013) «Morphology in Construction Grammar». En: Th. Hoffmann/ G. Trousdale (eds), The Oxford Handbook of Construction Grammar. Oxford: Oxford University Press, 255-273. BOSQUE, Ignacio (2001) «Sobre el concepto de ‘colocación’ y sus límites». LEA 1, 9-40. BOSQUE, Ignacio (2019) «On the conceptual bases of collocations: Restricted adverbs and lexical selection». En: S. Torner/ E. Bernal, E. (eds), Collocations and Other Lexical Combinations in Spanish: Theoretical, Lexicographical and Applied Pers- pectives. London: Routledge, 9-20. BREZINA, Vaclav (2018) Statistics in Corpus Linguistics: A Practical Guide (1st ed.). Cambridge University Press. https://doi.org/10.1017/9781316410899 BUSTOS PLAZA, Alberto (2005) Combinaciones verbonominales y lexicalización. Frankfurt: Peter Lang. ČERMÁK, František (2007) Frazeologia a idiomatika: česká a obecná. Praha: Nakla- datelství Karolinum. COLSON, Jean-Pierre (2015) «Editorial: Where does phraseology actually begin?». Yearbook of Phraseology 6, 1-2. Linguistica_2022_2_FINAL.indd 70 Linguistica_2022_2_FINAL.indd 70 5. 01. 2023 07:29:10 5. 01. 2023 07:29:10 71 COLSON, Jean-Pierre (2018) «Cognitive entrenchment, idiomaticity and corpora». En: A. Pamies/M. I. Balsas/A. Magdalena (eds), Lenguaje figurado y competencia interlingüística (I): Aspectos teóricos. Granada: Comares, 185-196. COLSON, Jean-Pierre (2019) «Multi-word Units in Machine Translation: why the Tip of the Iceberg Remains Problematic – and a Tentative Corpus-driven Solu- tion», paper presented at MUMTT2019, The 4th Workshop on Multi-word Units in Machine Translation and Translation Technology. Málaga: Universidad de Málaga. CORPAS PASTOR, Gloria (1996) Manual de fraseología española. Madrid: Gredos. CORPAS PASTOR, Gloria (2001) «En torno al concepto de colocación». Euskera XLVI/1, 89-108. CORPAS PASTOR, Gloria (2019) «Collocations in e-bilingual dictionaries». En: S. Torner/E. Bernal, E. (eds), Collocations and Other Lexical Combinations in Spa- nish: Theoretical, Lexicographical and Applied Perspectives. London: Routledge, 173-199. COWIE, Anthony (ed), (1998) Phraseologoy: Theory, Analysis, and Applications. Oxford: Oxford University Press CSERÉP, Attila (2017) «Idiom variation and decomposability Part I: Verbal varia- tion». Yearbook of Phraseology 8, 95-122. DOBROVOL’SKIJ, Dmitrij (2007) «Cognitive approaches to idiom analysis». En: H. Burger et al. (eds), Phraseologie: ein internationales Handbuch. Berlin: De Gruyter, 789-818. DOBROVOL’SKIJ Dmitrij (2020) «German constructional phrasemes and their Rus- sian counterparts: A corpus-based study». En: G. Corpas/J. P. Colson (eds), Com- putational Phraseology. Amsterdam: John Benjamins, 43-64. FIRTH, John R. (1957) Papers in Linguistics 1934-1951. Londres: Oxford University Press. GARCÍA-PAGE, Mario (1998) «Binomios fraseológicos antitéticos». En: G. Wotjak (ed), Estudios de fraseología y fraseografía del español actual Madrid: Vervuert/ Iberoamericana, 195-202. GARCÍA-PAGE, Mario (2008) Introducción a la fraseología española. Estudio de las locuciones. Barcelona: Anthropos. GARCIA-PAGE, Mario (2011) «Collocations complexes (application à l’espagnol)». Lingvisticae Investigationes 34/1, 67-111. GOUVERNEUR, Celine (2008) «The Phraseological Patterns of High-Frequency Verbs in Advanced English for General Purposes». En: F. Meunier/S. Granger (eds), Phraseology in Foreign Language Learning and Teaching. Amsterdam/Phi- ladelphia: John Benjamins, 223-246. GRIES, Stepan/STEFANOWITSCH, Anatol (2004) «Extending Collostructional Analysis: A Corpus-based Perspective on ‘Alternations’». International Journal of Corpus Linguistics 9/1, 97-129. GROSSMANN, Francis/TUTIN, Agnès (eds), (2003) Les collocations: analyse et trai- tement. Travaux et recherches en linguistique appliquée. Amsterdam: de Werelt. Linguistica_2022_2_FINAL.indd 71 Linguistica_2022_2_FINAL.indd 71 5. 01. 2023 07:29:11 5. 01. 2023 07:29:11 72 HARDIE, Andrew (2014) «Log Ratio – an informal introduction». ESRC Cen- tre for Corpus Approaches to Social Science (CASS). http://cass.lancs.ac.uk/ log-ratio-an-informal-introduction/. HAUSMANN, Franz-Joseph (1979) «Un dictionnaire des collocations est-il possi- ble?». Travaux de Linguistique et de Litterature 17/1, 187-195. HAUSMANN, Franz-Joseph (1998) «O diccionario de colocacións. Criterios de or- ganización». En: X. F. Ruibal/M. J. Anido Silvosa/M. C. Lamela Villaravid/M. C. Viqueira Liñares (eds), Actas do I Coloquio Galego de Fraseoloxía. Santiago de Compostela: Centro Ramón Piñeiro. ÍRSULA PEÑA, Jesús (1994) Substantive- Verb-Kollokationen. Kontrastive Untersu- chungen Deutsch-Spanisch. Frankfurt: Peter Lang. JAKUBIČEK Miloš/Adam KILGARRIFF/Vojtĕch KOVÁŘ/ Pavel RYCHLÝ/Vít SU- CHOMEL (2013) «The TenTen corpus family». En: A. Hardie/R. Love (eds), 7th International Corpus Linguistics Conference. Lancaster: UCREL, 125-127. KA Y, Paul/MICHAELIS, Laura A. (2012) «Constructional Meaning and Compositionali - ty». En: C. Maienborn/K. von Heusinger/P. Portner (eds), Semantics: An International Handbook of Natural Language Meaning. Vol. 3. Berlin: de Gruyter, 2271-2296. KILGARRIFF, Adam/ Irene RENAU (2013) «EsTenTen, a Vast Web Corpus of Penin- sular and American Spanish». En: 5th International Conference on Corpus Linguis- tics (CILC2013). https://core.ac.uk/download/pdf/82198444.pdf. KOIKE, Kazumi (2001) Colocaciones léxicas en el español actual: estudio formal y léxico semántico. Madrid: Universidad de Alcalá de Henares. KOIKE, Kazumi (2012) «Colocaciones complejas metafóricas». En: A. Pamies/J. M. Pazos/L. Luque Nadal (eds), Phraseology and Discourse: Cross-Linguistic and Corpus-based Approaches. Baltmannsweiler: Schneider, 73-80. KOLESNIKOV A, Olga (2016) «Survey of Word Co-occurrence Measures for Colloca- tion Detection». Computación y Sistemas 20/3, 327-344. LANGACKER, Ronald (1987–1991) Foundations of cognitive grammar, Vol. I [1987]/ Vol. II [1991]. Stanford: Stanford University Press. LANGACKER, Ronald W. (2008) Cognitive Grammar. A Basic Introduction. Oxford: Oxford University Press. MANNING, Chris/Hinrich SCHÜTZE (1999) Foundations of statistical natural lan- guage processing. Cambridge: MIT Press. MEJRI, S. (2011) «Figement, collocation et combinatoire libre». En: J. C. Anscombre/S. Mejri (eds), Le Figement linguistique : la parole entravée. Paris: Champion, 63-77. MEJRI, Salah (2012) «Délimitation des unités phraséologiques». En: M. L. Ortiz (ed), Tendências atuais na pesquisa descritiva e aplicada em fraseologia e paremiologia. Campinas, (São Paulo): Pontes, 139-156. MEL’ČUK, Igor A. (1998) «Collocations and lexical functions». En: A. J. Cowie (ed), Phraseology: Theory, analysis and applications. Oxford: University Press, 23-54. MEL’CUK, Igor A. (2003) «Collocations : définition, rôle et utilité». En: F. Grossman- n/A. Tutin (eds), Les collocations: analyse et traitement. Travaux et recherches en linguistique appliquée. Amsterdam: de Werelt, 23-31. Linguistica_2022_2_FINAL.indd 72 Linguistica_2022_2_FINAL.indd 72 5. 01. 2023 07:29:11 5. 01. 2023 07:29:11 73 MEL’CUK, Igor A. (2013) «Tout ce que nous voulions savoir sur les phrasèmes, mais…». Cahiers de lexicologie 102/1, 129-149. MELLADO BLANCO, Carmen (ed), (2008) Colocaciones y fraseología en los dicciona- rios. Frankfurt: Peter Lang. MELLADO BLANCO, Carmen (2014) «La polisemia en las unidades fraseológicas: génesis y tipología». En: V. Durante (ed), Fraseología y paremiología: enfoques y aplicaciones, Madrid: Instituto Cervantes, 177-195. MELLADO BLANCO, Carmen (2020a) «La desautomatización desde el prisma de la gramática de construcciones: un nuevo paradigma de la variabilidad fraseológica». Nasledje 45, 17-34. MELLADO BLANCO, Carmen (2020b) «Esquemas fraseológicos y construcciones fraseológicas en el contínuum léxico-gramática». En: E. Tabares et al. (eds), Clases y categorías en la fraseología de la lengua española. Frankfurt: Peter Lang, 13-36. MENDÍVIL GIRÓ, José Luis (1991) Las palabras disgregadas. Sintaxis de las expre- siones idiomáticas y los predicados complejos. Zaragoza: Prensas Universitarias de la Universidad. MICHAELIS, Laura A. (2019) «Constructions are Patterns and so are Fixed Expres- sions». En: B. Busse/ R. Moehlig (eds), Patterns in Language and Linguistics. Ber- lin: Mouton de Gruyter, 193-220. NAZAR, Rogelio/RENAU, Irene (2019) «A quantitative analysis of the semantics of verb-argument structures». En: Torner, S./Bernal, E. (eds), Collocations and Other Lexical Combinations in Spanish: Theoretical, Lexicographical and Applied Pers- pectives. London: Routledge,114-136. OSORIO OLA VE, Gabriela (2012) «Colocaciones, compuestos sintagmáticos y locu- ciones nominales: hacia un intento de delimitación conceptual». Lenguas Modernas 39, 103-116. PAMIES, Antonio/W ANG, Yuan (2020) «Frasemas verbales y metáfora gramatical en español y en chino». LynX 19 (Univ. Valencia), 89-145. PAMIES, Antonio (2007) «De la idiomaticidad y sus paradojas». En: G. Conde Tarrío (ed), Nouveaux apports à l’étude des expressions figées. Cortil-Wodon: InterCom- munications, 173-204. PAMIES, Antonio (2017) «Grammatical metaphor and functional idiomaticity». Year- book of Phraseology 8 (1), 69-104. PAMIES, Antonio (2019) «La fraseología a través de su terminología». En: J. J. Martín Ríos, (ed), Estudios lingüísticos y culturales sobre China. Granada: Comares, 105-134. PAZIENZIA, Maria Teresa/PENNACCHIOTTI, Marco/ZANZOTTO, Fabio M. (2005) «Terminology Extraction: An Analysis of Linguistic and Statistical Approa- ches». Knowledge Mining 185, 255-279. PEJOVIĆ, Andjelka/V ALOŽIĆ Luiza M. (2021) «La construcción fraseológica [Vmov + prep + {los cerros de Úbeda}] y sus posibles equivalentes contextuales en serbio». Komunikacija i kultura online 12, 196-213. PENADÉS Martínez, Inmaculada (2012) Gramática y semántica de las locuciones. Alcalá de Henares: Universidad. Linguistica_2022_2_FINAL.indd 73 Linguistica_2022_2_FINAL.indd 73 5. 01. 2023 07:29:11 5. 01. 2023 07:29:11 74 PENADÉS Martínez, Inmaculada (2017) «El concepto de colocación a la luz de las colocaciones del tipo verbo más locución adverbial». RILCE: Revista de filología hispánica 33/3, 963-991. PENADÉS Martínez, Inmaculada (2019) «The fixedness of combinatory relationships». En: Torner, S./Bernal, E. (eds), Collocations and Other Lexical Combinations in Spani- sh: Theoretical, Lexicographical and Applied Perspectives. London: Routledge, 75-91. POLGUERE, Alain (2007) «Soleil insoutenable et chaleur de plomb: le statut linguis- tique des greffes collocationnelles». http://olst.ling.umontreal.ca/pdf/Greffesco- lloc2007.pdf. RYCHLÍ, Pavel (2008) «A Lexicographer-Friendly Association Score». En: P. So- jka/A. Horák (eds), RASLAN 2008: Recent Advances in Slavonic Natural Language Processing, Karlova Studánka, Dec, 5-7, 2008. Brno: Masaryk University, 6-9. SINCLAIR, John (1991) Corpus, Concordance, Collocation. Oxford: Oxford Univer- sity Press. SINCLAIR, John; JONES, Susan/DALEY, Robert (1970) The OSTI report. Birmin- gham: University. STEFANOWITSCH, Anatol (2013) «Collostructional Analysis». En: Th. Hoffman- n/G. Trousdale (eds), The Oxford Handbook of Construction Grammar. Oxford / New York: Oxford University Press, 290-306. UZCANGA VIV AR, Isabel/GOMEZ FERNANDEZ, Araceli (2009) «Les greffes co- llocationnelles en espagnol». En: D. Beck et al. (eds), Proceedings [of the] Fourth International Conference on Meaning-Text Theory. Montréal: Observatoire de lin- guistique Sens-Texte (OLST), 349-356. WULFF, Stefanie (2013) «Words and Idioms». En: Hoffmann, Th. / Trousdale, G. (eds), The Oxford Handbook of Construction Grammar. Oxford / New York: Oxford University Press, 274-289. ZULUAGA, Alberto (2002) «Los ‘enlaces frecuentes’ de María Moliner. Observacio- nes sobre las llamadas colocaciones». LEA XXIV, 97-114. Diccionarios y corpus [AUT] (1726-1739) Real Academia Española Diccionario de autoridades. 6 vols. Ma- drid: Imprenta de Francisco del Hierro. (reed. facsímil). http://web.frl.es/DA.html. [COR] (1627. [1924]) Correas, Gonzalo Vocabulario de refranes y frases proverbiales y otras fórmulas comunes de la lengua castellana… [Reed. 1924 Tipografía de la Revista de Archivos, Bibliotecas y Museos]. https://www.rae.es/obras-academicas/ diccionarios/nuevo-tesoro-lexicografico-0. [CORPES XXI] (2022) Real Academia Española: Corpes XXI. Corpus del Español del Siglo XXI. http://www.rae.es. [COV] (1611. [1995]) Covarrubias, Sebastián de Tesoro de la lengua castellana, o es- pañola. Madrid: Luis Sanchez.] [reed. de F.C.Maldonado, Madrid: Castalia 1995]. [CREA] (2022) Real Academia Española: CREA Corpus de Referencia del Español Actual Banco de datos http://www.rae.es. Linguistica_2022_2_FINAL.indd 74 Linguistica_2022_2_FINAL.indd 74 5. 01. 2023 07:29:11 5. 01. 2023 07:29:11 75 [DFE] Cantera Ortiz De Urbina, Jesús y Gomis Blanco, Pedro (2007) Diccionario de fraseología española: locuciones, idiotismos, modismos y frases hechas usuales en español. Madrid: Adaba. [DEC] (1997) Martín Sánchez, Manuel Diccionario del español coloquial: (dichos, modismos y locuciones populares). Madrid: Tellus. [DLE] (2019) Real Academia Española. Diccionario de la lengua española, Madrid, Espasa. http:/www.rae.es. [DFDL] (2004) Seco, Manuel/Andrés, Olimpia/Ramos, Gabino Diccionario fraseoló- gico documentado del español actual: Locuciones y modismos españoles. Madrid: Aguilar. [ETT] (2011) Corpus Spanish Web (EsTenTen11_Eu+Am) (accesible desde [SKE]). [Redes ] (2004) Bosque, Ignacio (dir.) Redes. Diccionario combinatorio del español contemporáneo. Madrid: SM. [SKE] (2021) Sketchengine. www.sketchengine.eu. [TERR] (1786) Terreros y Pando, Esteban de Diccionario castellano: con las voces de ciencias y artes y sus correspondientes en las tres lenguas francesa, latina é italia- na. Madrid: Imprenta de la Viuda de Ibarra, Hijos y Compañía. Resumen ENTRE EL BINOMIO FRASEOLÓGICO, LA COLOCACIÓN COMPLEJA Y LA COLOSTRUCCIÓN: UN EXAMEN «LARGO Y TENDIDO» Pese a una persistente diversidad terminológica, se puede decir que, desde el punto de vista conceptual, la taxonomía del ámbito fraseológico ha avanzado hacia un loable con - senso en la última década. Quedan sin embargo algunas zonas polémicas o borrosas, como las colocaciones complejas y las «colostrucciones» (o ‘esquemas fraseológicos’), con las consiguientes dificultades técnicas para el reconocimiento de las mismas en un corpus electrónico. Ello repercute indirectamente sobre los límites del propio concepto teórico de colocación, que, dependiendo de cómo se defina, podría solaparse con estos tipos de frase - ma. Otra manera de enfocarlo es considerar que existe un mecanismo sintáctico productivo de imbricación fraseológica, por el cual un frasema puede encajarse en otro mayor sin constituir por ello una «nueva» categoría fraseológica. Por lo tanto, una locución adverbial podría formar parte de una colocación a mayor escala con un verbo (tanto por su semántica como por su frecuencia de coocurrencia), y seguir siendo una locución adverbial con otros verbos (Pamies 2017, 2019). Un caso muy representativo de esta indeterminación sería el de los binomios fraseológicos, que, en unos diccionarios fraseológicos aparecen clasifica - dos como locuciones adverbiales (a bombo y platillo) pero, en otros, como locuciones ver- bales (anunciar a bombo y platillo). Para examinar de cerca este problema, hemos elegido la expresión largo y tendido, que, pese a sufrir una fijación total, se combina preferente - mente con ciertos verbos, permitiéndose incluso sustituciones sinonímicas e hiponímicas entre los mismos. El estudio empírico (cualitativo y cuantitativo) de un gran corpus textual electrónico permite analizar todas las variaciones contextuales que afectan a su empleo, Linguistica_2022_2_FINAL.indd 75 Linguistica_2022_2_FINAL.indd 75 5. 01. 2023 07:29:11 5. 01. 2023 07:29:11 76 poniendo a prueba, de paso, la metodología estadística de detección automatizada de las colocaciones. La heterogeneidad observada es mucho mayor de lo que cabría esperar, pero también pone de manifiesto ciertas tendencias regulares. Palabras clave: colocación compleja, imbricación, esquema fraseológico, colostruc- ción, lingüística de corpus. Abstract BETWEEN THE PHRASEOLOGICAL BINOMIAL, COMPLEX PLACEMENT AND COLOSSTRUCTION: A “LONG AND EXTENDED” EXAMINATION Despite a persistent terminological diversity, it can be said that, from a conceptual point of view, the taxonomy of phraseology has advanced towards a commendable consensus in the last decade. There remain, however, some controversial or blurred areas, such as complex collocations and ‘collostructions’ (or ‘constructional idioms’), with the consequent technical difficulties in recognizing them in an electronic corpus. This has indirect repercussions on the limits of the theoretical concept of collocation itself, which, depending on how it is defined, may overlap these types of phraseme. Another way to approach this question is to consider that there is a productive syntactic mechanism of phraseological imbrication, whereby a phraseme can be embedded in a larger phraseme without constituting a ‘new’ phraseological category. Thus, an adverbial idiom could be part of a larger-scale collocation with a verb (both in terms of semantics and frequency of co-occurrence), while remaining an adverbial idiom with other verbs (Pamies 2017, 2019). A highly representative case of this indeterminacy would be that of phraseological binomials, which, in some phraseological dictionaries, appear classified as adverbial idioms (a bombo y platillo) but, in others, as verbal idioms (anunciar a bombo y platillo). In order to examine closely this problem, we have chosen the expression largo y tendido, which, despite being totally fixed, is preferentially combined with certain verbs, even allowing synonymic and hyponymic substitutions between them. A (qualitative and quantitative) empirical study of a large electronic textual corpus makes it possible to analyze all the contextual variations that affect its use, testing, at the same time, the statistical methodology of automated detection of collocations. The heterogeneity observed is much greater than expected, but it also reveals certain regularities. Keywords: Complex Collocation, Imbrication, Constructional Idiom, Collostruction, Corpus Linguistics Linguistica_2022_2_FINAL.indd 76 Linguistica_2022_2_FINAL.indd 76 5. 01. 2023 07:29:11 5. 01. 2023 07:29:11 77 Povzetek MED FRAZEOLOŠKIM DVOJČIČEM, KOMPLEKSNO KOLOKACIJO IN KOLOSTRUKCIJO: ANALIZA STRUKTURE “LARGO Y TENDIDO” Kljub trdoživi terminološki raznolikosti lahko rečemo, da je razvrščanje na frazeolo- škem področju s konceptualnega vidika v zadnjem desetletju napredovalo proti hvalev- rednemu konsenzu. Vseeno pa ostaja nekaj polemičnih ali zabrisanih področij, kot so kompleksne kolokacije in »kolostrukcije« (ali »frazeološke sheme«), s pripadajočimi tehničnimi težavami na področju njihovega prepoznavanja v elektronskem korpusu. To posredno vpliva na zamejitev samega teoretskega koncepta kolokacije, ki bi se, sicer odvisno od opredelitve, s temi vrstami frazemov lahko prekrival. Drugi možen pristop temelji na predpostavki o obstoju produktivnega skladenjskega mehanizma frazeolo- škega sovpadanja, v skladu s katerim se lahko določen frazem vdela v drugega, širšega, ne da bi se s tem oblikovala »nova« frazeološka vrsta. Tako bi prislovna stalna besedna zveza z določenim glagolom lahko tvorila širšo kolokacijo (tako s pomenskega vidika kot s stališča pogostosti sopojavljanja) in se z drugimi glagoli hkrati še vedno obnašala kot prislovna stalna besedna zveza (Pamies 2017, 2019). Zelo reprezentativen primer takšne nedoločnosti bi bili frazeološki dvojčiči, ki se v nekaterih frazeoloških slovarjih uvrščajo med prislovne stalne besedne zveze (a bombo y platillo (≈ z rompom in pom- pom)), medtem ko jih drugi štejejo za glagolske stalne besedne zveze (anunciar a bom- bo y platillo (≈ naznaniti z rompom in pompom)). Da bi težavo podrobno preučili, smo izbrali izraz largo y tendido (≈ na dolgo in široko), ki ga kljub popolni ustaljenosti raje povezujemo z določenimi glagoli, med katerimi celo dopušča nadomeščanje s sopo- menkami ali podpomenkami. Empirična (kvalitativna in kvantitativna) študija širokega elektronskega besedilnega korpusa omogoča analizo vseh kontekstualnih različic rabe, mimogrede pa tudi preizkus statistične metodologije avtomatiziranega zaznavanja ko- lokacij. Zaznana heterogenost je veliko večja, kot bi bilo pričakovati, vendar hkrati odraža nekatere ustaljene tendence. Ključne besede: kompleksna kolokacija, sovpadanje, frazeološka shema, kolostrukci- ja, korpusno jezikoslovje Linguistica_2022_2_FINAL.indd 77 Linguistica_2022_2_FINAL.indd 77 5. 01. 2023 07:29:11 5. 01. 2023 07:29:11 78 ANEXO Gráfi cos de los valores alcanzados por cada categoría en las diferentes medidas estadísticas. Linguistica_2022_2_FINAL.indd 78 Linguistica_2022_2_FINAL.indd 78 5. 01. 2023 07:29:11 5. 01. 2023 07:29:11