Collostructional Anaysis of Korean Aspect Auxurally Verb

Report
Covarying collexemes in the
Korean Auxiliary Verb,
-e/a twu- and –e/a nohBumyong Choi
University of Hawaii
[email protected]
Collocation, Construction, and
Collostruction

Collocation (연어)
disregard syntactic structure
• “word that occur with a frequency that is significantly above
chance-level in a given span around the node word”
e.g.,) Collocations of auxiliary verb 두- (+/- 4어절 span): 어, 아,
고, ㄴ, 었, 하, 에, 을, 를, 는…
(http://rocker.snu.ac.kr:8080/search 세종말뭉치검색기)
• If we can identify collocations of an auxiliary verb construction –
어 두-:
• 내버리, 남기, 넣, 세우, 쌓, 접, 묻, 숨기, 모으, 제치… (Choi,
forthcoming)

 provide finer-grain analysis
Collostruction (연구문)
• starts with a particular construction and investigates which
lexemes are strongly attracted or repelled by a particular slot in
the construction”
 Collocation of words and syntactic structure
Collostructional analysis

Collexeme analysis (Stefanowitsch & Grise 2003)
• measures the degree of attraction/repulsion of a lemma to a slot
in one particular construction
• –어 두-: 내버리, 남기, 넣, 세우, ……

Distinctive collexeme analysis (Gries & Stefanowitsch 2004)
• measures the preference of a lemma to one particular
construction over another, functionally similar construction
• -어 두-: 내버리, 놓, 보, 남기, 알, …..
• -어 놓-: 내리, 내, 털, 올리, 늘, ……

Covarying collexeme analysis (Stefanowitsch & Gries 2005)
• measures the degree of attraction of lemmas in one slot of a
construction to lemmas in another slot of the same construction
• slot1-어 두(놓)-slot2: collocation between slot1 and slot2
Covarying collexeme analysis (CCA)
It measure strength of association between V1stem and V2suffix in
a particular auxiliary verb construction (-어 두/놓- 구문).
[slot1] 어두[slot2]
The distribution of cechi- and –ko in the –e/a twu- construction
-ko “and”
other suffix
Column total
ceychi “clear away”
45 (9)
8 (44)
53
other verbs
711 (747)
3622 (3586)
4333
Row total
756
3630
4386
Fisher’s exact test (statistical probability of error)
p=3.11E-26 ( the association between ceychi and the conjunctive
suffix –ko is very strong )
Transform p value to Log10-value : 25.6
Why CCA for Korean AVCs?

No studies focus either on the suffixes of V2 or on the interaction
between V1 and suffixes of V2.
• [V1stem]-e [V2stem]+[V2suffixes]
(1) The earlier discussion on AVCs mainly focus on the semantic and
syntactic features of V2(stem), or covers the qualities and features of
V1(stem) (Sohn, 1999; Kang, 2006)
(2) The role of V2(suffix) is disregarded or marginally considered.
수미가 예뻐 놔서(*둬서), 모든 남자들이 만나고 싶어 했다.

Most data are from researcher’s creation or based on their intuition
• Some studies are based on real language use in corpus data (Kang, 1996;
Ho, 2003; Strauss 2002) but very few studies on quantitative analysis of
V1-e V2 constructions (Park, 2003)
Purpose of this study

To investigate whether there are interaction between V1 and
suffixes of V2 in a particular Korean AVC (i.e. –어 두- and -어
놓-)

To identify certain grammatical units (or conventionalized
forms) from the target AVC which consist of a certain main
verb and a suffix.

To examine how the distinctive semantic features of two
auxiliary verbs, -어 두- and –어 놓- manifest in the choice of
the main verbs and suffixes of the target AVC using corpusbased analysis
Korean Auxiliary Verb Constructions,
–어 두다 and –어 놓다

Korean Auxiliary verb construction(AVC)s
• Developed from the corresponding main verbs through syntactic
and semantic changes (i.e. grammaticalization)
• SVCAVC (Oh, 1998; Rhee, 1996; Sohn, 1999; You, 1996)

When –어 두 and –어 놓 is used as SVC
• Both verbs have a semantic feature of “placement”
• 존이 컵을 찬장에 올려 두었다 / 존이 컵을 찬장에 올려 놓았다.
• -어 두- has a semantic features of “preservation”

When –어 두 and –어 놓 is used as AVC
• Both verbs have a semantic feature of “completion” and “maintaining the
result”.
• 존이 숙제를 해 놓았다. / 존이 숙제를 해 두었다.
• 어 두 has a semantic feature of “preparedness”.
Method

Corpus: Sejong SEM-tagged corpus
• 13,000,000 ecel
• Semantic & Part-of-Speech Tagged corpus

Procedure and Tools
• Extract target constructions: “Hanmaru”
• “두/vx” or “놓/vx” (vx: auxilairy verb, vv: verb)
• “두”: 4238 tokens / “놓”: 9715 tokens
• Modify the extracted data  secondary corpus
• Extract “collexeme” (“main verbs and suffixes.”):
•
“TEXTSTAT2.1” using “Regular Expression”
Covarying Collexeme Analysis (Running statistics): “R”
with the script “Coll.Analysis 3.1”
Sejong Sem-tagged corpus
First extracted data with Hanmaru
Modified secondary corpus
Second extracted data with Textstat 2.1
Result: Covarying collexeme of –어 두-and –어 놓- 구문
-어 두- 구문
coll.strength
제쳐 두고
25.859
남겨 두고
19.682
알아 둬야
12.051
세워 둔
10.054
해 두자
9.041
모아 둔
9.008
밝혀 둔다
8.563
말해 두지만
7.796
내버려 두지
7.629
접어 두고
7.519
믿어 두고서
6.002
해 둬야
5.61
쌓아 둔
5.495
말해 두거니와
5.477
내버려 둬
5.28
숨겨 둔
4.989
덥어 두기
4.716
강조해 두고자
4.548
묶어 두려
4.196
덥어 두려
4.079
-어 놓-구문
coll.strength
빼 놓을
25.653
드러내 놓고
12.47
바꿔 놓을
11.886
앉혀 놓고
11.129
불러 놓고
10.475
말해 놓고
10.448
세워 놓고
10.35
제쳐 놓고
9.149
파 놓은
8.382
되어 놔서
8.243
시켜 놓고
8.183
옮겨 놓으면서
8.085
이뤄 놓은
7.846
끝내 놓고
7.7
바꿔 놓는
7.387
제쳐 놓더라도
6.966
정해 놓고
6.723
쏟아 놓는
5.64
내려 놓으시
5.539
옮겨 놓다가
5.363
coll.strength>4
 p<0.0001
Result: Covarying collexeme of –어 두-and –어 놓- 구문
-어 두- 구문
coll.strength
제쳐 두고
25.859
남겨 두고
19.682
알아 둬야
12.051
세워 둔
10.054
해 두자
9.041
모아 둔
9.008
밝혀 둔다
8.563
말해 두지만
7.796
내버려 두지
7.629
접어 두고
7.519
믿어 두고서
6.002
해 둬야
5.61
쌓아 둔
5.495
말해 두거니와
5.477
내버려 둬
5.28
숨겨 둔
4.989
덥어 두기
4.716
강조해 두고자
4.548
묶어 두려
4.196
덥어 두려
4.079
-어 놓-구문
coll.strength
빼 놓을
25.653
드러내 놓고
12.47
바꿔 놓을
11.886
앉혀 놓고
11.129
불러 놓고
10.475
말해 놓고
10.448
세워 놓고
10.35
제쳐 놓고
9.149
파 놓은
8.382
되어 놔서
8.243
시켜 놓고
8.183
옮겨 놓으면서
8.085
이뤄 놓은
7.846
끝내 놓고
7.7
바꿔 놓는
7.387
제쳐 놓더라도
6.966
정해 놓고
6.723
쏟아 놓는
5.64
내려 놓으시
5.539
옮겨 놓다가
5.363
coll.strength>4
 p<0.0001
-어두고: 제쳐두고, 남겨두고, 접어두고



Suffix-고: connect two events
AVC-어 두: preparedness “예비성”
Main Verb 제치다, 남기다, 접다: separation “대상물에 대한 분리”
• “ 그 선수는 골키퍼를 제치고 골을 넣었다.” 주어가 목적어를 분리
• “배가 불러서 밥을 남겼다” 전체에서 부분의 분리
• “대통령이 되고자 하는 생각을 접었다.” 상황의 중단

제쳐두고, 남겨두고, 접어두고: exclusiveness “제외/제거”
• “나는 방학이 되면 공부는 제쳐두고 신발공장에서 아르바이트를 하며…”
•
•
( 주로 일과 관련된 목적어)
조선 성종 때 윤석보 군수는 부인을 남겨 두고 임지로 떠났다. ( 주로
사람과 단체)
Note: 남겨두고 있다(19): 절차, 일정을 vs 남기고 있다: 글, 기록을
내일 만나면 그런 핑계는 접어두고 우리 솔직한 얘기만 하자. (문제,
불만, 기쁨 등 추상명사)
-어둔: 세워둔, 모아둔, 쌓아둔, 숨겨둔





Suffix ‘-ㄴ’: past tense noun modifying form
SVC /AVC–어 두: “preservation”
Main Verb 세우다, 모으다, 쌓다, 숨기다: 대상물의 위치 변화와
관련
세워둔, 모아둔, 쌓아둔, 숨겨둔: “대상물의 위치를 바꿔
preserve 한”
대상물이 해당동사와 직접 관련이 있는 구체물
•
•
•
•
세워둔 차량, 세워둔 채
모아둔 돈
쌓아둔 볏집, 짚단
숨겨둔 재산, 돈
Perception verbs+어두:알아두어야, 알아둘,
확인해두어야

Perception verbs: “-어 두-” 와 “-어 놓-”의 distinctive
collexeme
• 두-놓: 알아 (111-8), 익혀 (22-2), 확인해(13-1))

주로 deontic meaning으로 사용
• 알아두어야(27), 확인해두어야: -어야 (당위)
• 알아둘 (필요)
• 알아둘 필요가 있다
• 익혀두는 (선호)
• 익혀 두는 것이 좋다/낫다/바람직하다
 V1의 의미적 특성이 전체 구문의 의미적 특성에 영향을
받고 결과적으로 구문구조에 제약을 갖게 됨
Communication verbs + 어 두: 밝혀 둔다,
말해 두지만, (밝혀 두고자, 강조해 두고자)

밝혀 둔다(12): “to express”(11), “to light”(1)
• [ ]ㅁ을 밝혀둔다 (8)
• “대부분 가명을 사용하였음을 밝혀둔다”

밝혀두고자(3)와 강조해 두고자(3)
• [ ]ㅁ을 밝혀/강조해두고자 한다
• “강력히 투쟁해 갈 것임을 분명히 밝혀 두고자 한다”
 특정한 화용적 상황에서 사용되고 있으며 이들 모두 plain style
ending으로 사용되고 있다. (formal writing format)

말해 두지만(5)
• “미리 말해 두지만(4)”, “분명히 말해 두지만(1)”과 같이 하나의
고정된 표현으로 사용.
-어 놓을:빼 놓을, 바꿔 놓을, (뒤바꿔 놓을)

빼 놓을(24/47),
• 빼 놓을 수 없- (22): 없는(18), 없다(4)
• “또 하나 그녀의 얼굴 중에서 빼 놓을 수 없는 것이 보조개”
• “초등학교시절, 기억에 남는 일 가운데 가을 운동회를 빼 놓을 수 없다.”

바꿔 놓을(27/221) 뒤바꿔 놓을 (6/23)
• 바꿔 놓을 “수/것/터/줄”
• “바꿔 놓을 수 있다”
• 누군가의 사소한 행동 하나가 인류의 미래를 바꾸어 놓을 수도 있는
•
것이다.
경영자의 하나의 결단이 기업의 미래를 완전히 뒤바꿔 놓을 수도 있다.
어 놓고: 드러내, 앉히, 부르, 말하, 세우, 제치,
시키, 끝내, 정하

두 사건의 순차적 연결: 앉혀놓고, 불러놓고, 말해놓고, 세워놓고,
시켜놓고, 끝내놓고, 정해놓고
• 두다(preservation), 놓다(placement)의 원형적 의미의 차이가 반영
• ‘두다’가 가지는 “preservation”의 의미가 연결어미 ‘-고’와 연결시 단순한
쓰임 이상의 의미를 부여

제쳐두고 vs. 제쳐놓고, 제쳐놓더라도
• “앞뒤 문맥은 제쳐놓고(두고) 문장 하나를 뚝 떼어 가지고”

드러내 놓고: lexicalization
• “군은 잘못을 드러내 놓고 용서를 구할 때 국민의 신뢰를 얻을 것이다.”
• “북한이 영변에서 드러내 놓고 고폭실험을 한 흔적을 남기고…”
• “덮어 놓고”, “대 놓고”
Violation of selectional restriction:
자동사/형용사의 경우


Selectional restriction (-어 두-, -어 놓-): V1 = transitive verb
자동사: 되어 놔서
• 워낙 낮게 지은 집이 되어 놔서 천정도 답답할 정도로 낮았다.
(원인)

형용사
•
•
•
•

“이렇게 늦어 놓고서도 비 핑계나 대고” (양보)
“거기다 책마다 얘기가 달라 놔서” (원인)
“요즘엔 주변에 이혼하는 사람들이 하도 많아 놔서” (원인)
“날씨가 워낙 추어 놓으니 아이들도 소풍이고 뭐고 집에 가기를
좋아했다.” (원인)
-어 두-는 자동사와 형용사 결합이 거의 나타나지 않음 (1회)
• “왜 미리 친해 두지 그랬어?” (“예비성”의 강화)
Summary

In the Korean AVC, main verbs and the suffixes of auxiliary
verbs interact each other in some ways.

CCA can be used to detect grammatical units and direction to
grammaticalization/lexicalization. (e.g., 제쳐두고, 말해 두지만,
빼 놓을 수 없는 것이, 드러내 놓고…)

CCA shows that the selection of the main verb and suffixes of
the auxiliary verb are closely related to the prototype meaning
of the auxiliary verb. (제쳐두고, 남겨두고, 접어두고 /
앉혀두고, 불러두고, 모아두고, 시켜두고…)

With the suffixes such as –어서 and -으니 “since,” the
selectional restriction of main verb in an AVC can be
unconfined. (많아 놔서, 추워 놓으니)
Pedagogical Implication

CCA can be used to detect conventionalized expressions or
emergenting grammatical units.
• Other AVC, SVC
• 명사구 보문 구문: Vㄴ/ㄹ/는+의존명사/명사+조사
• 기타: N1적인 N2, V1도록 V2

Teaching Korean AVCs: -어 두- and –어 놓- construction
• Teaching as a chunk: “만사 제쳐 두고,” “미리 말해 두지만”,
“~중에 빼 놓을 수 없는 것은 ~이다”, “드러내 놓고”…
• Some expressions are not fixed but still shows preference in the
choice of lexeme.  Use them as examples in developing
teaching material. (차를 세워둔 채, 숨겨둔 돈을, 아들을
앉혀놓고 이야기를 시작했다, 자장면을 시켜놓고 전화를 걸었다)
Thank you














References
Choe, H. (1965). Urimalpon (Our Grammar). Seoul: Cengumsa.
Choi, S. (2003). Serial verbs and the empty category. Paper presented at the Proceedings o
f the workshop on Multi-Verb constructions, Norwegian University of Science and Technolo
gy, Trondheim.
Jang, M.-r. (2000). Hankwuke poco yongenui sangcek yangthaycek uimi kinungkwa thongs
acek thukcing (The aspectual & modal meaning of Korean auxiliary verbs and their syntacti
c properties). Paytalmal, 38, 33-59
Lee, H.-S. (2001). kwukeui sang cheykyeywa poco yongenui sangcek uimi (On the aspectual
system and aspectual meaning of auxiliary verbs in Korean). kwunehak, 38, 209-253.
Lee, K.-D. (1979). cotongsa 'nohta'ui uimi yenku (A study of the Korean auxiliary verb 'noht
a'). Hangul, 163, 465-496.
Lee, K.-D. (1993). A Korean Grammar on Semantic-Pragmatic Principles. Seoul: Hankwu
kmwunhwasa.
Martin, S. E. (1992). A reference grammar of Korean : a complete guide to the grammar a
nd history of the Korean language (1st ed.). Rutland, Vt. ; Tokyo: C.E. Tuttle.
Oh, S.-s. (1998). A syntactic and semantic study of Korena auxiliaries: a grammarticaliza
tion perspective. University of Hawaii, Honolulu, HI.
Rhee, S. (1996). Semantics of Verbs and Grammaticalization: The Development in Korean
from a Cross-linguistics Perspective. University of Texas at Austin
Sohn, H.-M. (1999). The Korean language. Cambridge, U.K. ; New York: Cambridge Univer
sity Press.
Sohn, S. (1994). poco yongenui uimiey kwanhan yenku (A study of the meaning auxiliary pr
edicate). Hangul, 223(107-223).
Stefanowitsch, A., & Gries, S. T. (2003). Collostructions: Investigating the interaction betwe
en words and constructions. International Journal of Corpus Linguistics, 8(2), 209-243.
You, S.-H. (1996). Argument licensing in complex verbal constructions in Korean. Unpubli
shed Ph.D., University of Hawai'i, United States -- Hawaii.
Semantic features of 두다 and 놓다

Shared semantic features of 두다 and 놓다

The distinctive meaning of 두다
• “movement and placement of the patient”
• ‘to place something where under agent’s control’ (Lee 1993)
• Focus is on the goal argument: ‘to place something for future use
or with agent’s intention’ (e.g., 컵을 찬장에 두다)
• ‘to keep’ 보유하다
 Prototype meaning

The distinctive meanings of 놓다
• ‘to release something’ (out of agent’s control) (Lee 1993; Jung
2007) (e.g., 컵을 손에서 놓다)
• Focus is on the source argument
 Prototype meaning
 ‘to release’ 벗어나게 하다
• ‘to place something onto a place’ (with the goal argument)
• Focus is on the goal argument (e.g., 컵을 책상 위에 놓다)
‘to place’ 있게 하다.
 Extended meaning
Result: Covarying collexeme of –어 두- construction
-e twu제쳐 두고
남겨 두고
알아 둬야
세워 둔
해 두자
모아 둔
밝혀 둔다
말해 두지만
내버려 두지
접어 두고
해 두어야
쌓아 둔
내버려 둬
숨겨 둔
덥어 두기
묶어 두려
덥어 두려
묶어 둘
알아 둘
받아 두었
# of main verb
53
257
111
120
199
89
42
41
287
72
199
87
287
69
76
71
76
71
111
20
# of suffix
756
756
206
772
33
772
133
10
147
756
206
772
52
772
133
14
14
241
241
750
joint feq
45
107
27
52
13
41
12
5
30
33
26
34
14
28
11
4
4
13
17
11
log10 -value
25.859
19.682
12.051
10.054
9.041
9.008
8.563
7.796
7.629
7.519
6.002
5.61
5.495
5.477
5.28
4.989
4.716
4.548
4.196
4.079
Result: Covarying collexeme of –어 놓- construction
-e twu빼 놓을
드러내 놓고
바꿔 놓을
앉혀 놓고
불러 놓고
말해 놓고
세워 놓고
제쳐 놓고
파 놓은
돼 놔서
시켜 놓고
옮겨 놓으면서
이뤄 놓은
끝내 놓고
바꿔 놓는
제쳐 놓더라도
정해 놓고
쏟아 놓는
내려 놓으시
옮겨 놓다가
# of main verb
47
78
201
87
44
63
256
70
42
6
45
175
28
17
201
70
120
76
23
175
# of suffix
236
3229
236
3229
3229
3229
3229
3229
2172
42
3229
16
2172
3229
325
7
3229
325
41
7
joint feq
24
59
27
62
37
48
141
50
28
4
35
7
21
17
25
4
70
13
4
4
log10 -value
25.653
12.47
11.886
11.129
10.475
10.448
10.35
9.149
8.382
8.243
8.183
8.085
7.846
7.7
7.387
6.966
6.723
5.64
5.539
5.363

similar documents