Sunteți pe pagina 1din 18

Errores ms comunes para corregir:

1.Los anotadores olvidan aadir cosas siendo cuantificadas por la etiqueta QUANT. Las etiquetas
correctas son: segunda fila[QUANT] la cuarta economa ms grande[QUANT] 202 camiones
de abono[QUANT]. Solamente sepralos si la cosa siendo cuantificada es una entidad: "Compr
10[QUANT iPhones[COMM]"

2. Grupos de personas de una cierta localizacin o etnias son etiquetas plurales PERSONA, no
MISC ni ORG: "Rusos[PER] llegaron en grupo en 1990[DATE]", Los Turcos
Otomanos[PER] hacen buen caf"

3. Las etiquetas EVENTO no deben ser separadas en cosas como Fechas y Localizaciones:
"Recuerdo la masacre de armenios en 1992 [EVENTO]"

4. Las etiquetas de cantidad QUANT deben incluir designaciones como "ms que", "sobre", "mas
de", "por encima de" en cantidades como "mas de 10 computadoras[QUANT] fueron
comerciadas" y "mas de 50 personas[QUANT] llegaron"

5. Las MARCAS frecuentemente no son tratadas contextualmente.

a. Los fabricantes deben ser separados como Marca: "Servidor[COMM] de


Window[BRAND]", "FORD[BRAND] MUSTANG[COMM]", "OpsWork[BRAND]
Stack[TTULO:SOFT]"

b. MARCA sigue siendo MARCA cuando es usada como sustituto para un producto: "Amo mi
PC[MARCA]", Tu Ford[MARCA] est daado"

c. Debe ser organizacin ORG cuando se refiere a una entidad fsica ("Yo trabajo en
Ford[ORG]" o acciones tomadas ("Cocacola[ORG] lanz un nuevo producto)

6. Localizaciones usadas como sustituto para burocracias, entidades polticas, y equipos deben ser
marcados como ORG ("Boston[ORG] gan el juego", "Rusia[ORG] rellen una demanda",
"Washington DC[ORG] nuna logra nada"

7. Para Hashtags y Nombres de Usario, solo deben ser marcados como una entidad si la referencia
despues del #/@/etc... es a una entidad, Persona, Organizacin, Marca etc.

Reconocimiento de una entidad nombrada.


Una entidad nombrada es cualquier referencia, ya sea un nombre propio completo, un apodo, una
versin corta, una abreviacin, un acrnimo o una entidad unica en el mundo. Esa entidad puede
ser una Persona, una Fecha, un Producto Comercial o un objeto metafsico.

Por ejemplo: En el texto: "Yo disfrut viendo La caza para la gente salvaje protagonizada por
Sam Neill en el Teatro Roxy el sbado pasado", deberas identificar cuatro entidades:

La caza para la gente salvaje protagonizada [TTULO:PELCULA]

Sam Neill [PER]

Teatro Roxy [LOC]


sbado pasado [FECHA]

Tipos de entidades:

1. Persona (PER): Individuos, grupos de personas, apodos, personajes de ficcin, nombres de


animales, etc...

2. Localizacin (LOC): Ubicaciones fsicas como: paises, ciudades, lagos, edificios, planetas,
coordenadas geograficas, calles, nacionalidades, etc...

3. Organizacin (ORG): Gobiernos, compaas, religiones, equipos deportivos, etc...

4. Marca (MARCA): La organizacin, grupo, o productora de un articulo comercial especfico o


lnea de productos.

5. Artculo comercial (COMM): iPhone, Corolla LX, Barbie, etc... (cualquier producto no
genrico que se pueda comprar)

6. Ttulo (TTULO): Nombre de cualquier creacion o trabajo artstico creativo que no entra en
las sub-categoras: Pelcula, Cancin, Libro, Software, or Juego.

7. Pelcula (TTULO:PELCULA): Nombre de una pelcula, ya sea nombre completo, apodo o


un subttulo.

8. Cancion (TTULO:CANCIN): Nombre de una cancin, ya sea completo o parcial.

9. Libro (TTULO:LIBRO): Nombre de un libro, ya sea profesional o auto publicado.

10. Software (TTULO:SOFT): Nombre de un producto software lanzado oficialmente.

11. Juego (TTULO:JUEGO): Nombre de un juego, ya sea un videojuego, un juego de mesa, o


un juego comn.

12. Evento (EVENTO): Festival, conciertos, elecciones, gerras, conferencias, etc...

13. Fecha (FECHA): Cualquier referencia a una fecha o tiempo, sea especfica, general,
absoluta, o relativa.

14. Cantidad (QUANT): Todas las medidas junto a sus unidades (moneda, porcentaje, numeros,
bytes etc...)

15. Otro/Miscelneo(MISC): Cosas que son entidades nombradas pero no entran en ninguna de
las categoras anteriores. (Ejemplo: Lenguajes, identidades tnicas no vinculadas a un pas de
origen)

Definicin de entidades:

NOTA: Para los diferentes ejemplos de tipos de entidades abajo, las entidades resaltadas en
Verde son el tipo de entidad de la que se esta hablando. Todas las entidades resaltadas en
Amarillo tambien son entidades nombradas pero de un diferente tipo que ocurren al mismo
tiempo en la oracin.

Persona (PER): El nombre de un individuo o grupo de individuos.


Incluye un solo nombre o apellido (Ejemplo: Bob)

Incluye apodos y nombres coloquiales (Ejemplo: Robert the Bruce, Gronk)

Incluye nombres en plural (Ejemplo: Los Clintons)

Incluye personajes ficticios (Ejemplo: Gollum, Zeus), aunque los usos idiomticos no se
incluyen ("Dios mo eso es un pastel grandsimo" "Ay Cristo lo hizo otra vez" puesto que no
contienen referencia a una persona.

Incluye nombres metafsicos (Ejemplo: El Miedo)

Incluye otros nombres de personajes animados, como mascotas (Ejemplo: Mr.Fuzzypants)


dibujos animados (Ejemplo: Mickey Mouse), otros animales (Ejemplo: Mr.Ed)

Incluye referencias a individuos a travs de otros identificadores como perfil en redes sociales
(Ejemplo: @tenniscool123, @realDonaldTrump)

Referencias a Dios en forma nominal ("Yo creo en Dios"), pero no en foma general ("Si existe
un dios, entonces estar bien")

Incluye ttulos oficiales asociados con el nombre (Ejemplo: "Me reun con el Presidente
Clinton", "El Vice Rector Phillips se jubil", "Cundo se jubilar el Lider de la Mayoria de
Senados McConell?", "Por favor invita a la Abogado del Condado del Estado Anita Alvarez a
la reunin")

Incluye plurales para grupos de personas de lugares especficos ("Los Europeos vienen") o de
ciertas nacionalidades ("Los Rusos hacen la mejor sopa") incluso si se combina una ubicacin y
etnia (Los Turcos Otomanos hacen buen caf)

Incluye etiquetas separadas para multiples personas mencionadas juntas ("Mis amigos Kelsey y
Kate Graham llegaron")

Incluye referencias basadas en un ttulo para individuos nombrados especficos, especialmente


cuando estn en mayscula. ("El anterior Governador de Florida debera ser descalificado", "El
actual Presidente de los Estados Unidos no encaja para el trabajo"

NO incluye el lugar del cual una persona es, si ya la persona ha sido mencionada
explicitamente. (Ejemplo" Me reun con el Presidente Obama de los Estados Unidos[LOC]")

NO incluye referencias de trabajo ("ve para el carnicero") a menos que que est en mayscula y
usada como un apodo. ("El Carnicero gan otra ronda en la pela de MMA") o que este
refirindose contextualmente a un individuo mencionado ("El Canciller y La Secretaria
llegaron a la ceremonia de inscripcin")

NO incluye ttulos de trabajos no obtenidos: "Ella se est postulando para presidente" ya que no
contiene una entidad nombrada.

NO incluye referencias pronominales (Ejemplo: yo, l, ella) o relaciones familiares ("mi padre")

NO incluye ttulos honorficos (Ejemplo: "Sr. Edward Jones", "Dr. Daniel Swingley") a menos
que el ttulo honorfico sea parte de su nombre oficial (Ejemplo: Mr T, Dr. Dre)

NO inlcuye sufijos obtenidos durante su vida (PhD) pero incluye sufijos que forman parte del
nombre propio (Ejemplo: Sammy Davis Jr., Michael Jones III)

Como regla de oro: si el url de la pagna de Wikipedia incluye el ttulo, sufijo, etc,
probablemente es parte de su nombre.

Localizacin (LOC): Nombre de una ubicacin fsica.

Incluye pases, ciudades, direcciones, nombres de edificios.

Incluye estructuras hechas por el hombre: (La 5ta Avenida, El Puente Tobin), edificios
(Edificio Empire State), monumentos, (Monumento a Martin Luther King Jr.)

Incluye apodos para ubicaciones (La Gran Manzana, 30 Rock)

Incluye ubicaciones ficticias (Mordor, El Pas de Nunca Jams)

Incluye localizaciones celestiales (Jpiter)

Incluye ubicaciones geogrficas (Lago Hyness, Montaa McKinley, La frontera entre


Estados Unidos y Canada")

Incluye usos especficos de Marcas u Organizaciones cuando son usadas par referirse a un lugar
especfico ("Regres al Hilton a las 9pm", "Llegamos a Amazon despus de cenar") pero NO si
son usadas de manera genrica ("Me quede en el Hilton[MARCA]", "La Posada
Hampton[MARCA] es mucho mas limpia")

Modificadores de direcciones como "sur, ms alto" siempre deben ser incluidos como parte de
la ubicacin (Ejemplo: Europa Oriental/Europa del Este, Corea del Norte") a menos que
sean referencias adjetivales que no modifican la ubicacin (Ejemplo: cocina
surea,hospitalidad del norte)

Incluye designadores tales como: Prefectura/Distrito/Estado/Cuenca que especifiquen que tipo


de ubicacin es (Ejemplo: "Visit la Prefectura Fukushima el ao pasado", "La Cuenca de
Mexico")

NO incluye designadores que aparecen antes de la localizacin (Ejemplo: "estado" no es parte


de la etiqueta "el estado de Utah")

NO incluye decticos u otros nombres no propios (aqu, all, cerca)

NO incluye pases, ciudades, estados, imperios, etc... cuando hacen referencia a la estructura
burocrtica y no a la localizacin geogrfica, la cual debe ser clasificada como organizacin
(Ejemplo: "Los Estados Unidos[ORG] invadieron", "El Gran Imperio Romano se extedi por
todo el mundo")

No incluye generalidades ("fin de seman en el lago", "escal la montaa" NO deben contener


etiquetas de localizacin) incluso si aparecen con una ubicacin actual (Ejemplo: "Vol al
aeropuerto de Londres" aeropuerto queda fuera de la ubicacin)

NO incluye referencias genericas como "el mundo" o "la galaxia"

Debe siempre incluir el elemento ms largo de ubicacin posible (Ejemplo: Por favor envalo a
"Calle Growning 123. Nueva York, Estados Unidos")

Organizacin (ORG): El nombre de una compaia o grupo de personas organizadas. Una


organizacin tpicamente es un grupo de personas que estn formalmente organizadas, unidas
por algn documento como articulos de incorporacin o un dogma religioso, y tienen una
existencia establecida y persistente.

Incluye Religiones (Cristianismo, Wicca)

Incluye Acrnimos (ONU, UE)

Incluye Agencias Gubernamentaes (Congreso, La administracion Presidencial, Oficina de


Fiscales)

Incluye Medios de Comunicacin y Entrenimiento (El Nacional, Compaa Teatral


Shakespeare)

Incuye organizaciones deportivas (Real Madrid, Federacin de Ftbol de Chile)

Incluye nombre de hospitales, museos, bibliotecas, etc... a menos que sea claro que es una
referencia de ubicacin, en cuyo caso debe ser marcada como localizacin.

Incluye formas adjetivas de organizaciones indicando membresa (Ejemplo el vecino


Cristiano, Mi amigo es un desarollador de Apple)

Incluye organizadores de eventos cuando son usados para referirse a la organizacin en vez de a
un evento actual (Ejemplo: Los Grammys anunciaron 10 nominaciones El scar le pidio a la
academia votar rpido

Incluye publicadores de libros en un contexto bibliogrfico (Ejemplo: Meyerhoff,


Miriam[PER]

(2006[DATE]). Introduccin a la Sociolinguistica, 2da edicin[TTULO:LIBRO]


Londres[LOC] Routledge[ORG])

Incluye fabricantes de software y tecnologa en lnea incluso cuando el nombre de su Software


como un Servicio es el mismo al nombre de la organizacin (Ejemplo: del.ici.ous, Browsr,
Twitch, Instagram, Facebook, GitHub, CNET News, ZDNet). Sin embargo, el contexto es de
suma importancia para distinguir si es la Organizacin a quien se hace referencia o el
SOFTWARE en s. (Ejemplo Descargu Facebook[TITLO:SOFT] from the app store)

No incluye grupos de personas estrechamente asociadas (Ejemplo the thirty-something


outdoorsy tech worker crowd)

NOTA: Algunas veces es difcil diferenciar ente una organizacin y un grupo de personas. A
menos que se haga referencia a un subconjuto especifico, colocaremos Organizacin en vez de
Persona para entidades como: "La Tropa de Estados Unidos", "La polica de Chicago", etc...

Marca (MARCA): Organizacin/grupo/productor de un artculo especfico.

Usualmente se refiere a el nombre del fabricante cuando es usado en un escenario comercial.


Muy a menudo al nombre completo de la compaa, pero en algunos casos denotar una
sucursal significativa dentro de una gran farmilia corporativa.

Frecuentemente se dar junto con un Artcuo Comercial (Ejemplo: "Hoy compr un iPhone
6[COMM] de Apple[MARCA]", Viste mi nuevo Ford[MARCA] Mustang[COMM] en el
garaje?

Incluye nombre de Marcas cuando son usadas para sustituir una familia o productos
comerciales. (Ejemplo: "Compr una Apple[MARCA] para remplazar mi PC[MARCA] y
realmenteme la amo")

Incluye fabricantes de software ("Mi servidor Windows"), (bebe "la nueva CocaCola
Zero[COMM]"), naves espaciales ("La nueva nave espacial de NASA Voyager[COMM] dej la
galaxia")

DESAMBIGUACIN: Las Marcas frecuentemente se refieren a organizaciones que pueden ser


marcadas como ORG en un escenario no comercial. Por ejemplo, mientras que "Apple" es una
Marca en "El nuevo iPhone de Apple[MARCA]", es una Organizacin en "Apple[ORG] est
presionando el gobierno para suavizar sus reglas de inmigracin". Las Marcas son seleccionadas
solamente cuando son usadas en un escenario directamente comercial refirindose a un producto,
comprable, adquirible o compartible.

Artculo Comercial(COMM): El nombre de un producto especfico en una referencia no


genrica.

Cualquier artculo no genrico que sea comprable o adquiribe dirigido por un nombre
especfico. (Ejemplo: Barras NutriGran, iPhone 5)

Incluye cualquier cosa que tendra una pgina de producto en Amazon, Target, etc...

Incluye solamente las lineas de producto de alto nivel, usualmente registradas como "marca
registrada" ( Ejemplo: iPhone, Corolla)

Incluye los modelos de lineas de producto (Ejemplo: iPhone 6s, Corolla LE)

Incluye todos los tipos de vehculos (Ejemplo: 747, HMS Nelson)

Incluye la versin del producto si sta es parte de el nombre (Ejemplo: MacBook Air II)

Incluye productos grandes que solo tuvieron un artculo fabricado (Ejemplo: Apollo II, SS
Titanic)

Incluye referencias a artculos comerciales individuales por un identificador unico como ASIN -
Nmero de Identificacion Estandar de Amazn, por sus siglas e ingls-(Ejemplo: Please order
item B00ODDE33U on Amazon.com) or SKU

Incluye etiquetas separadas para mltiples artculos comerciales juntos, incluso si la referencia
son nmeros de partes (Ejemplo: Por favor, ordena la parte W10311524, 2319308, &

W10335147")

Incluye el nmero de versin de un producto (Ejemplo: Compra un nuevo iPhone


6s[COMM]!)
NO inlcuye referencias genricas a productos que pueden ser fabricados por cualquier compaa
(Ejemplo: Compr un nuevo telfono hoy, mi carr ya esta viejo, Mi nuevo controlador de
internet inalmbrico es genial)

NO incluye el tipo de producto cuando es usado junto al nombre oficial del artculo comercial
(Ejemplo camioneta no es parte de la entidad nombrada en "Compre una nueva camioneta
Volvo[MARCA] V70[COMM]")

No incluye marcas cuando son usadas como sustituto de el artculo comercial (Ejemplo: Amo
mi Ford[MARCA], el Roku[MARCA] estuvo increble, Viene con la PC[MARCA]?

NO incluye productos que pueden ser fabricados por diferentes compaas incluso si contienen
un trmino en mayscula (Ejemplo: I need a USB 2.0[MISC] stick)

NO incluye atributos como dimensiones ("Mi iPad Pro[COMM] de my 12

[QUANT])

Nota: Muy frecuentemente los Artculos Comerciales sern mencionados juntos con una marca,
en cuyo caso la marca debe ser sealada de forma separada al artculo comercial (Ejemplo:
Compr un iPhone 6s[COMM] de Apple[BRAND] ayer", Ese es Ford[BRAND]
Mustang[COMM] muy rpido!)

Si el artculo comercial es un libro, pelcula u otro trabajo de artstico al que se le hace


referencia por medio de un ttulo, entonces debe ser marcado como el ttulo principalmente en vez
de un artculo comercial (Ejemplo: "Ayer compr Paz y Guerra[TTULE:LIBRO] en
Amazon[ORG]

Ttulo (TTULO): Nombre de cualquier creacin u obra de arte creativa no capturada por las
subcategorias: Pelcula, Cancin, Libro, Software o Juego

Incluye el nombre de cualquier trabajo creativo que no encaje en uno de las cinco subcategoras
de TTULO (Pelcula, Cancin, Libro, Software, Juego)
Incluye Pinturas (Ejemplo: "Has visto la Mona Lisa?"
Incluye Esculturas (Ejemplo: "l est sentado all como El Pensador")
Incluye Poemas (Ejemplo: "El Cuervo es una obra maestra")
Incluye ttulos de Leyes/Legales (Ejemplo: Declaracin de Derechos, Pacto de Varsovia,
cdigo IRS 4, Seguridad Social)
Incluye nombres de danzas (Ejemplo: Tabata, Waltz)
Incluye nombres de ejercicio (Ejemplo: Zumba, Ciclismo)
Tambin incluye bailes, fotos, ensayos, premios, programas de radio
Incluye encabezados de peridicos si se usan de manera referencial (es decir, el ttulo no es
marcado como ttulo si ests marcando el artculo de peridico en s, pero s se incluye si otro
texto se refiere a este artculo por su encabezado)
Incluye ttulos de episodios de una serie, subttulos de captulos de libros, nombres de blogs
Incluye ttulos de documentos electrnicos (Word, Excel, etc ...)
NO incluye referencias genricas a obras de arte como "la pintura" o "su primera pelcula"
No incluye seccin, captulo, subttulo, o cualquier otro designador ms all del
titulo principal
NO incluye la fecha asociada a una publicacin, ya sea ttulo completo o single
(Ejemplo: "Acabo de comprar la edicin ligera de Food and Wine [TITULO] Agosto
2017[FECHA]
NOTA: Si el ttulo de algo est siendo discutido en un contexto comercial, como un libro siendo
vendido en Amazon o una cancin que se compra en iTunes, se debe marcar como TITULO en
vez de un artculo comercial, ya que es principalmente un ttulo, y siempre puede ser identificado
como el artculo que se vende en ese contexto.

Pelcula (TTULO: PELCULA): Nombre de una pelcula, miniserie o programa de televisin,


ya sea nombre completo, apodo, o subttulo-
Incluye ttulos completos de pelculas (Ejemplo: "Me encanta Doctor Strangelove")
Incluye referencias de pelculas acortadas (Ejemplo: "Viste FF3?" acrnimo para Rapido y
Furioso por sus siglas en ingls", o "Me encant Ultron "por" Iron Man: Era de Ultron ")
Incluye programas de televisin (Ejemplo: "Me encanta ver 60 minutos", "Seinfeld fue mi
comedia situacional favorita")
Incluye miniseries o programacin de video original producida en lnea, ya sea en Netflix,
Youtube, Amazon, etc ... (Ejemplo: "Netflix acaba de lanzar nuevas temporadas de Jessica Jones
y Puo de Hierro")
NO incluye nombres de videos autnomos publicados en Youtube o Vimeo (el nombre dado a
un vdeo especfico, que se muestra debajo del video), que debe marcarse solo como TTULO.
NO incluye ttulos de proyectos de video producidos para propsitos tales como proyectos de
clase, infomerciales, o propsitos de entrenamiento, los cuales son TTULO.
NOTA: Aunque el ttulo se refiere especficamente a Pelculas, comnmente asociadas con la
categora pelculas de metraje, la categora debe capturar cualquier video/cinematografa
producida ya sea un corto, un documental, una miniserie o un programa regular. Esto incluye en
gran parte contenidos formalmente producidos y/o con fines comerciales.

Cancin (TTULO: CANCIN): Nombre de una cancin ya sea total o parcial


Incluye canciones lanzadas por artistas modernos (por ejemplo, "Love me do" por los Beatles,
"Aleluya!" de Leonard Cohen)
Incluye himnos y canciones clsicas
Incluye referencias coloquiales a canciones (Ejemplo: "por favor, canta la Cancin de
Cumpleaos")

Libro (TITULO: LIBRO): Nombre de un libro (ficcin, no ficcin, historietas, grfico), ya sea
profesionalmente publicado o autopublicado.
Incluye libros comunes publicados (Ejemplo: "Lo que el Viento se Llevo es un clsico!")
Incluye novelas grficas (Ejemplo: "Pens que Watchmen: Los Vigilantes original era mejor
que la pelcula")
Incluye historietas (Ejemplo: "las nuevas historias de X-Men y Avengers son increbles!")
NO incluye diarios (Nature[TTULO]), revistas (Variedades, Estampas, Men's
Health[TTULO]), o peridicos (The New York Times [TTULO]), los cuales deben ser todos
clasificados como un "TITULO" regular.
NO incluye nombres de artculos dentro de revistas, diarios o peridicos (TTULO)
NO incluye ttulos de piezas acadmicas, incluso si se trata de disertaciones de
Publicado explcitamente en formato libro (clasificado como TTULO solamente)

Software (TITULO: SOFT): Nombre de un producto de software lanzado oficialmente


Incluye softwares regulares descargables que la gente compra (Ejemplo: Word, Excel,
Photoshop, Quickbooks)
Incluye softwares que vienen en los telfonos (Ejemplo: Google Maps, Photos, App Store)
Incluye softwares como un servicio, independientemente del mecanismo de distribucin
(Ejemplo:, "Me gusta ir a AppleMusic para comprar mis canciones"," Lo poste en Facebook ")
Incluye personificaciones de sistemas de software que son usados para comunicarse con ellos
(Ejemplo: "pregntale a Siri cmo llegar al centro comercial", "Alexa, cul es el clima?")
Incluye lenguajes de programacin ya que son softwares (Ejemplo: Java, Python, .php, .html)
Incluye software utilizado a travs de portales en lnea de las principales organizaciones
(Ejemplo: "Yo uso AWS [BRAND] Redshift [TITULO: SOFT] para almacenar mis datos ","
Ponlo en Google [BRAND] Docs [TITULO: SOFT]")
Incluye el nmero de versin de el software, junto al ttulo principal.

Juego (TTULO: JUEGO): Nombre de un juego, ya sea un videojuego, un juego de mesa o un


juego comn
Incluye videojuegos (Ejemplo: "Grand Theft Auto II", "World of Warcraft")
Incluye juegos de mesa (Ejemplo: "Colonos de Cataan", "Monopolio")
Incluye juegos de aplicaciones para telfonos (Ejemplo: "Candy Crush", "Preguntados")

Evento (EVENTO): Un evento nombrado.


Incluye cualquier evento con nombre, como un festival, concierto, elecciones, guerra o
conferencia.
Incluye eventos naturales como huracanes con y terremotos con nombre (Ejemplo: el Huracn
Andrew, El gran Terremoto de San Francisco)
Incluye menciones metonmicas de la fecha (Ejemplo: Los eventos del 11 de septiembre de
2001), ubicacin (Ejemplo: La batalla de Gettysburg), o la organizacin involucrada (Ejemplo:
El Escndalo Enron) de un evento
Incluye el nombre completo del evento, aunque contenga lo que de otro modo sera una
Org/Marca (Ejemplo: "Voy a la conferencia de Amazon cada ao", "Me encanta ver WWE
Smackdown")
Incluye nombres completos de eventos junto con designadores locativos o temporales si se usan
comnmente para referirse al evento en su totalidad (Ejemplo: "Aprend sobre la masacre de
armenios de 1912")
NO incluye eventos genricos. ("Juego de ftbol" y "guerra" no son eventos en "Jugu en el
partido de ftbol "o" la guerra es el infierno")
Nota: Aunque algunas ontologas tienen Evento como una subclase de Ttulo, especficamente
las mantenemos separadas para permitir una deteccin de eventos ms fcil.
NOTA: El contexto es muy importante. As, mientras que "Palestina" es normalmente un lugar,
si el contexto es "un relato del xodo Palestino[EVENTO]", entonces el evento completo debe
ser marcado.

Fecha (FECHA): Cualquier expresin de fecha/hora


Incluye fechas completas (Ejemplo: 12/12/2015), fechas relativas (Ejemplo: el prximo
Martes, hace muchos aos), y tiempos ( Ejemplo: hace 5 minutos, 6 a.m.)
Incluye referencias para perodos de tiempo ms largos, como dcadas (Ejemplo: los aos 70),
siglos (Ejemplo: el siglo XVI) y eras (Ejemplo: D.C)
Incluye expresiones de tiempo con medidas no estndares de tiempo (Ejemplo:, "Los reportes
del cuarto trimestre"," Reporta todas las ganancias en el ao imponible","el prximo ao fiscal
ser bueno")
Incluye modificadores y preposiciones que indican tiempos especficos (Ejemplo: hace 2 das,
los ltimos dos das)
Incluye la hora general del da (Ejemplo: ayer por la maana, esta tarde,
principio del mes)
Incluye tiempos y fechas relativas (Ejemplo: "hace varios aos") aunque sea vaga en el
momento exacto (Ejemplo: "lo compr un rato despus de que sali")
NO incluye referencias genricas no especficas a las estaciones (Ejemplo: "Me encanta el
verano"), ni tiempos del da (Ejemplo: "prefiero caminar por la maana")
NO incluye designadores como "el ao" en "el ao 2017"
NO incluye usos idiomticos de fechas y horas (Ejemplo: "Siempre hay un prximo ao", "son
2pm en algun lugar ")
NO incluye aos cuando se usa como nmero de modelo o versin y no es real
referencia a la fecha (Ejemplo: Windows Server 2017)
NO debe incluir perodos de tiempo como "por 4 minutos", los cuales deben ser clasificados
como cantidad
NO debe incluir expresiones de frecuencia como "una vez al da" o "dos veces al ao", las
cuales deben clasificarse como Cantidad
Los intervalos de fechas deben marcarse como entidades separadas (por ejemplo, "l vivi all
desde el otroo de 1962 a travs de la primavera de 1967 antes de mudarse"," 22 de febrero de
1732-14 de diciembre de 1799")
Debe contener siempre el mayor intervalo de FECHA posible en la entidad individual (por
ejemplo, "Nac a las 5 de la maana del 7 de marzo de 1981", "sucedi en la noche del 2 de
julio ")

Cantidad (QUANT): Cualquier cantidad.


Una cantidad es cualquier valor o valor junto con una unidad de medida, donde la unidad de
medicin puede ser estndar o especfica para el contexto. Si la unidad de medida es una entidad
(Ejemplo: artculo comercial, org), entonces slo el valor numrico se considera la cantidad
Incluye todas las medidas junto con sus unidades estandarizadas (Ejemplo: 4 millas, 8 onzas,
100 aos)
Incluye moneda, porcentaje, nmero, bytes, etc ... incluyendo sus smbolos ($ 5.00, 20 MB,
43%)
Incluye nmeros en letra (Ejemplo: Treinta Dolares)
Incluye aproximaciones (Ejemplo: alrededor de la mitad, ms de 1/4, ms de 10)
Incluye unidades de medida arbitrarias, cuando sean necesarias para entender lo que est siendo
cuantificado (Ejemplo: 300 personas, 12 camiones de estircol, 10 nuevos escritorios, 6
preguntas importantes)
Incluye nmeros ordinales (Ejemplo: primero, segundo, ciento uno, 23avo), incluyendo
formas adverbiales (Ejemplo: Primeramente), y siempre con la cosa que se est contando
(Ejemplo: "primer libro", "La cuarta mayor economa")
Incluye nmeros cardinales, incluyendo nmeros enteros, fracciones, decimales, etc ... que no
tienen unidad de medida (Ejemplo: 432.3, centenares, un tercio, alrededor de la mitad)
Debe incluir modificadores asociados con cantidades (Ejemplo: slo 30%, alrededor de 10
grados celcius, ms de 70)
Las medidas multidimensionales representan cantidades mltiples (Ejemplo: "la caja es de 10,6
pulgadas X 10.6 pulgadas X 0.5 pulgadas","el equipo gan el juego 103-95 "), a menos que sea
una sola cantidad con trminos mltiples (Ejemplo:"Tom 1 mes, 1 da para hacer el proyecto",
"Escrib un cheque por 10 mil, 587 dlares y 34 centavos")
Los rangos deben ser cuantificados como dos cantidades (Ejemplo: "compr algo entre 10-20kg
de papas")
Las submuestras cuantificadas deben dividirse en la cantidad muestreada y la cantidad de el
conjunto total como cantidades separadas (Ejemplo: "Dicen que 1 de nuestros 3 dentistas
prefieren mi pasta dental")
Incluye perodos de tiempo que no son especficos en la lnea de tiempo (Ejemplo: "Le durante
5 minutos")
Incluye edades (Ejemplo: "Tiene 4 aos") y dimensiones (Ejemplo: "Mide 3 pulgadas de
largo")
Includes shorthand notation for measures (e.g. box contains 5x phones, since 5x is
shorthand for 5 instances of...
Incluye enumeraciones despus del articulo siendo contado (Ejemplo: "a los 8 aos mont en
bicicleta", "siempre sucede el da 2", "la referencia est en la pgina 5", "estoy en la pgina 1 de
7")
Incluye expresiones de tasa, ya sean palabras individuales (Ejemplo: anualmente), simples
(Ejemplo: "2 veces al da"), o complejas (Ejemplo: "2 cucharadas de azcar por taza de
harina")
Incluye cantidades, como "todos los carros", "cada caja", "todas las personas"
Incluye cantidades genricas tales como "una gran suma de dinero", "muchas personas
estaban ah"
Incluye plurales genricos como "aos" y "edades", ya que son sustituto de "muchos aos" y
"muchas edades"
NO incluye trminos que contengan incidentalmente un nmero en ellos (por ejemplo, "USB
2.0", "Versin 1", "Batera 9v", "serie 123")
NO contiene conteos de unidades si no se cuantifica directamente ("Conoc a un nio" no
contiene una cantidad ya que "un" es slo un determinante, pero "El carro tena 3 nias y
un nio" tiene 2 cantidades ya que "un" en este caso es 1)
NO contiene trminos que estn relacionados con cuantificaciones como "dual", "triple",
"sencillo" cuando son usadas como adjetivos (Ejemplo: "shampoo de accin doble", "protector de
salud triple", "copias de uso nico")
NO contiene trminos en los que se utilizan nmeros de una manera no cuantificativa (Ejemplo:
"cuenta de tercera persona", "fuentes secundarias")
NO incluye entidades completas de otro tipo si estn siendo cuantificadas. Por ejemplo: en los
siguientes casos, slo la parte de nmero debe marcarse como una cantidad, con la parte
cuantificada marcada como una entidad separada:
1. "Compr 12 [QUANT] Playstations [COMM] de Sony [MARCA]"
2."Todos los 50,000 [QUANT] asistentes al partido Chargers vs Broncos del 23 de
Noviembre [EVENTO] de la NFL [ORG] "
3.Tengo 3 [QUANT] paquetes de cartas coleccionables de primera edicin de la serie
conmemorativa del mundial del 2010 de los gigantes de San Francisco [COMM]
ADVERTENCIA: El contexto es muy importante para diferenciar una FECHA de una
CANTIDAD. Mientras que "75 Aos "es una Cantidad," hace 75 aos "es una FECHA. Las
CANTIDADES se refieren a algo que est siendo contado, mientras que las FECHAS se refieren
a ubicaciones o un perodo en una lnea de tiempo.

Otro/Miscelneo (MISC): Cualquier entidad con nombre que no encaje en ninguna de las
definiciones anteriores
Esta etiqueta debe usarse cuando el texto se est refiriendo a una entidad especfica pero no
encaja claramente en ninguna de las categoras anteriores. Esto NO debe ser utilizado para casos
donde la categora no est clara o puede ser ms de una. Slo si la entidad realmente no pertenece
a NINGUN de las otras categoras, pero es definitivamente una entidad con nombre.
Especficamente, los siguientes tipos deben ser clasificados como Miscelneos
(NOTA: esto no es una lista exhaustiva)
4.Idiomas, ya sean reales (Ejemplo: Ruso), ficticios (Ejemplo: Klingon), o jerga
(Ejemplo: Spanglish, Piglatin)
5.Etnias (Ejemplo: rabe, Latina, Chino-Americano, Americano)
6.Nacionalidades (Ejemplo: Ruso, Chino, Australiano)
7.Los trminos de marcas comerciales utilizados para referirse a los componentes del
producto (Ejemplo: "Usuarios Activos a Diario", "Carrito de Compras") caratersticas
(Ejemplo: Delgado, Ultra Silencioso), o trminos tcnicos (e.g.
DynamoDBTable). NOTA: Slo si estn en maysculas.
8. Signos astrolgicos (Aries, Geminis, etc...) a menos que sean usados para referire a la
ubicacin en el espacio donde esas constelaciones residen.
9.Nombres Propios de entidades cientficas(Aurora Polar, Canis lupus, CRISPR)
10.Medidas que no son cantidades, como tamao (Ejemplo: Pequeo, Mediano,
Grande), incluso si es una talla especfica con el producto (Ejemplo:jeans 32-E),
tamaos de colchones (Ejemplo: Twin, Queen, King), pureza (Ejemplo: anillo de oro
24k)
11.URLs (Ejemplo: www.google.com, https://sftp.mysite.org)
12.Direccines IP (Ejemplo: 192.268.1.1)
13.Nmeros de telfono (Ejemplo: 1-800-343-2323, 215-car-talk)
14.Direccines de correos (Ejemplo: me@mysite.com) Nota: Aunque los correos
electrnicos son miscelneos, los nombres de usuario que son referencias directas a las
personas siendo etiquetados como Persona(Ejemplo: menciones de redes sociales como
"Vi a mi amigo @jayallenconrad [PER] en el cine" o "Hey @coolchica123 [PER], te
amo!!!!)
15.Secciones, captulos, designadores legales de sub-encabezados (Ejemplo:Section
392, USC 3.0 (s1.2)")
16.Nombres de imprevisto que se le dan a creaciones temorales (Ejemplo: Postalo en la
Bveda de Ideas)
17.Nombres de imprevisto que se le dan a un grupo de personas (Ejemplo: Solo la lite
Americana crey en ella)
18.Nombres estndares como (Ejemplo: DNS, TTL) o formato (Ejemplo: PDF, GIF)
19.Ttulos oficiales obtenidos por profesionales (Ejemplo: PhD, MSc, MA)

No es una Entidad: Algunas cosas nunca son entidades nombradas

* El texto en un idioma extranjero nunca debe ser etiquetado como una entidad con nombre
* Transcripciones fonticas de las palabras nunca son entidades nombradas

Entidades nombradas en contexto local


Las etiquetas deben ser determinadas basadas en el contexto inmediatamente disponible, no a
travs de suposiciones acerca de la intencin o los metadatos sobre el documento que no
estara disponible si todo lo que fue dado, fue el texto crudo. Adems, slo la oracin
inmediata debe ser considerada para decidir si algo es una entidad y el tipo de entidad que es.
Si el contexto inmediato de la oracin deja algo ambiguo, entonces el contexto dentro del
documento puede ayudar a determinar la accin propia, pero no informacin adicional. Sin
embargo, si dado el contexto de la oracin no existe ambiguedad, entonces todo el documento
no debe ser considerado.

Determinando la extensin apropiada para las etiquetas.


En todos los casos, estamos interesados en la etiqeta mas larga y mas exterior para cada una de las
entidades que estn siendo anotadas. No estamos interesados en coleccionar etiquetas anidadas (dentro
de) o sobrepuestas.
Ejemplo: (Sobrepuestas)
En la oracion "Elegimos al nuevo Alcalde de Londres, Inglaterra", uno estara tentado de marcar "
Alcalde de Londres" como una Persona y " Londres, Inglaterra" como una ubicacin. Sin
embargo, como esto se refiere a un solo individuo, esperamos que toda la oracin sea marcada
como un solo tipo de entidad "Persona"

Ejemplo: (Anidado)
En la oracin "Le El Retrato de Dorian Gray", uno estara tentado a marcar "El Retrato de Dorian
Gray" como "TTULO:LIBRO" Y marcar la estrctura inadada en esta oracin "Doran Gray"
como Persona. Sin embargo, siguiendo el principio del Alcance mas Largo, esperamos solo una
etiqueta para toda la oracin "El Retrato de Doran Gray" como "TTULO: LIBRO"

Contra Ejemplo (Donde separar es necesario)


En algunos casos, el principio "Alcance mas largo" puede ser violado cuando las entidades
ms pequeas son juzgadas para ser mas crtico para el contexto que en el alcance ms
extenso. El principal ejemplo de esto involucra cantidades con un designador de sustantivo
muy largo. Por ejemplo si el texto se refiere a "Todos los 50,000 asistentes al partido Charger
vs Broncos del 23 de Noviembre de la NFL", donde "todos" puede ser llamado una Cantidad.
No obstante, debido a que la cosa siendo calificada contiene entidades explicitas de otro tipo,
"50000" debe ser macado como Cantidad , "NFL" como organizacin, y "Partido Charger vs
Broncos del 23 de Noviembre" como un Evento. El motivo es que "50000 asistentes" es lo
que se esta contando, y el resto es informacin aclaratoria, y por lo tanto merece ser anotada
de forma separada. Si, por ejemplo, existe un artculo comercial a la venta llamado "
asistentes al partido Charger vs Broncos del 23 de Noviembre de la NFL foto enmarcada"
todo deber ser marcado como un "Artculo Comercial".

Anotaciones de etiquetas mltiples.

Mientras que en un futuro puede ser ventajoso coleccionar posibles etiquetas mltiples para el
mismo elemento, actualmente estamos limitando nuestras anotaciones a 1 etiqueta por 1
elemento . Sin embargo, en el caso donde dos etiquetas pueden ser lgicamente aplicadas,
solo una de ellas debe ser seleccionada como la ms representativa en el contexto dado. Por
ejemplo, "Luego de graduarse de la secundaria, John volvi a visitar la secundaria Marietta
frecuentemente para caminar alrededor del campus", el elemento "Secundaria Marietta"
podra lgicamente ser una organizacin o un lugar. Es decisin de la persona decidir si el
contexto apunta mas hacia un lugar o una organizacin. Ya que la oracin habla de caminar
alrededor del campus, la etiqueta Localizacin es ms apropiada. Pero si la oracin terminara
as "visita la secundaria Marietta para reunirse con el director y evaluar su modelo de
educacin" entonces en ese caso, la etiqueta Organizacin es ms apropiada.

Entidades que son comnmente confundidas.

1. Organizacin vs Localizacin
Algunas entidades pueden ser tanto Localizacin como Organizacin dependiendo del
contexto. Es importante considerar qu aspectos de una entidad estn siendo resaltados en el
contexto antes de decidir una etiqueta. Si se concentra en la estructura organizacional,
funcin, o comportamiento de la entidad, entonces es una Organizacin. Si, se concentra en el
espacio fsico o la ubicacin relativa (ya sea, estar ah, llegar ah, relatando dnde est)
entonces debe ser marcada como Localizacin.
20.P or ejemplo, "Estados Unidos" y "Boston" son Localizaciones por defecto,
pero ambas pueden ser ORG o LOC
21."Los Estados Unidos iniciaron una guerra": ORG
22."Me mud a Estados Unidos": LOC
23."Boston gano el juego de basquet": ORG
24."Amo caminar en Boston": LOC
b. Igualmente, algo que es ORG por defecto como "Secundaria Marietta" o "Google"
pueden ser LOC dependiendo del concepto.
25."El director de la Secundaria Marietta expidi un nuevo cdigo de
vestimenta" ORG
26."Amo visitar la Secundaria Marietta para ver como han cambiado los campos
de ftbol" LOC
27."Googl lanz un nuevo telfono" ORG
28."Amo caminar alrededor de Google, y ver como las personas estn enfocadas
en su trabajo" LOC

2. Organizacin vs. Persona:


A veces los nombres de las organizaciones pueden ser sustitutos para grupos de personas
especficas, en cuyo caso la etiqueta Persona debe ser utilizada en vez de ORG. Por defecto, si la
mencin se refiere a toda la entidad, use Organizacin, si la mencin se refiere a un subconjunto
especifico de el grupo de personas involucradas en algun evento especifico, se marcan como
Persona.
Por ejemplo: "Las Tropas Estadounidenses" puede ser tanto ORG como PER en estos
casos:
a. Las Tropas Estadounidenses establecieron unas nuevas polticas antiacoso.:
ORG
b. Me encontre a Las Tropas Estadounidenses patrullando la calle: PER

3. Organizacin vs Ttulo
Algunas veces el nombre de una compaia de fabricacin puede referirse tanto a la compaa
haciendo la fabricacin o a la fabricacin en s, particularmente con programas de televisin. El
contexto siempre debe ser usado para determinar si la referencia es a una organizacin o a el
contenido producido. Por ejemplo: "The Daily Show" puede ser tanto ORG como Ttulo en estos
casos:

a. The Daily Show ha realizado una donacin para los nios de Africa: ORG
b. El mejor programa de televisin es: The Daily Show: TITULO

4. Organizacin vs. Marca:


a. La mayora de las marcas son tambin las organizaciones que fabrican los productos
comercializados bajo esa marca. En este caso, debe elegirse la etiqueta apropiada basada en el
contexto. Si el contexto es comercial, se refiere a productos que pueden ser comprado, adquirido,
o transferido de cualquier forma, debe marcarse como Marca. Sin embargo, si la referencia no
involucra productos, y se refiere a algn aspecto, funcin o participacin de la organizacin, debe
utilizarse la etiqueta Organizacin. Por ejemplo, "Apple"Puede ser ORG y MARCA en estos
casos:
i. Mi entrevista de trabajo en Apple sali increble: ORG
ii. Amo los nuevos productos de Apple que estn siendo lanzados: MARCA
b. A veces la marca puede ser el nombre utilizado en la comercializacin de un conjunto de
productos que no son una organizacin en s. Por ejemplo, "Nesquik" y "Always" son marcas que
pertenecen a la empresa "Nestl" y "P&G", respectivamente. Sin embargo, a veces las personas
pueden usarlas equivocadamente para referirse a la empresa haciendo la fabricacin, en cuyo caso
deben ser marcados con esa intencin. Aunque no son la empresa real. As que en estos casos,
incluso Nesquik y Always puede ser ORG:
i. Un vaso de Nesquik es delicioso: MARCA
ii. Consegu un trabajo en la fbrica de Nesquik: ORG
iii. Compr la nueva Always ayer: MARCA
iv. El departamento de comercializacin de Always ha lanzado una nueva campaa
publicitaria: ORG

5. Evento vs FECHA/LOC/ORG
A menudo se hace referencia a los eventos utilizando la ubicacin en la que se produjeron, la
fecha en la que ocurrieron, o la organizacin involucrada en ellos. Para estas referencias, si est
claro en el contexto en que la intencin es referirse al Evento ms que al identificador que enlaza
a el evento, entonces debe utilizarse la etiqueta Evento. En los siguientes ejemplos el Evento es
contrastado por cada una de las tres posibles referencias:
a. "Despus de Gettysburg, la guerra empeor mucho": EVENTO
b. "Las tropas llegaron a Gettysburg para la batalla mortal": LOC
c. "El gobierno us el 9/11 como excusa para una guerra mortal": EVENTO
d. "Todo el mundo recuerda dnde estaban el 9/11": FECHA
e. "Desafortunadamente, las leyes de armas no cambiaron despus de lo de la Escuela
Secundaria Columbine: EVENTO
f. "Su hija asisti a la Escuela Secundaria Columbine hasta el tiroteo": ORG

6. Fecha vs Cantidad
Las expresiones que implican unidades de tiempo, ya sean segundos, horas, das, aos o
siglos, pueden ser Fechas o Cantidades dependiendo del contexto y el uso. Si la expresin
proporciona informacin sobre cundo ocurri un evento o se refiere a un momento
especfico en la historia, debe utilizarse Fecha. Sin embargo, si la expresin describe la
duracin, la frecuencia o cualquier otro uso que no apunta a un lugar en una lnea de
tiempo, entonces se debe marcar como Cantidad. Por ejemplo, "5 minutos" puede ser
Fecha o Cantidad en los siguientes casos:
a. "Lleg all [hace 5 minutos] para la cena": FECHA
b. "Esper en fila durante [5 minutos] antes de salir": QUANT

7. Ttulo vs. Artculo Comercial


Ttulos y Artculos Comerciales estn inherentemente mezclados ya que muchas cosas
que tienen un ttulo apropiado pueden ser creadas, comercializadas y vendidas. Por lo
tanto, las etiquetas TITULO a menudo aparecen en contextos comerciales (por ejemplo,
libros a la venta en Amazon, canciones a venta en iTunes). La prioridad en estos casos es
centrarse en el TTULO, de modo que cualquier cosa que sea un TTULO apropiado (Ya
sea CANCION, LIBRO, SOFTWARE, JUEGO, PELCULA, etc ...) est marcado como
tal incluso cuando est siendo comercializado o a la venta.

Otros tips/orientaciones para las anotaciones.

1. Hashtags y Nombres de Usuario:


En las redes sociales a menudo vemos hashtags comenzando con "#" o referencias a
usuarios (nombre de usuario) empezando con "@". En ambos casos, el contexto debe
utilizarse para determinar si el contenido debe ser marcado como un elemento. En el caso
de hashtags, cualquier cosa que aparezca despus del hashtag debe ser usado para hacer
esta determinacin. En el caso del nombre de usuario, en cualquier caso en el que el
nombre de usuario se refiere a un individuo especfico, la etiqueta Persona debe ser
usada. Sin embargo, los nombres de usuario a menudo son establecidos por
organizaciones, organizadores de eventos, cuentas satricas, etc ... por lo que el contexto
siempre debe ser utilizado cuidadosamente. Mientras Hashtags y Nombres de Usuario
pueden ser muchos tipos de entidades diferentes, slo parte del trmino puede ser la
Referencia real. Si es posible, solo deber ser seleccionada la parte relevante. ( A menos
que la interfaz limita la seleccin a todos los smbolos)

a. Posibles Hashtags: Persona: "#BarackObamaRocks", Evento: "#Oscars2016",


Ubicacin: "#HamiltonBeach", Organizacin: "#AmazonWebServices", Marca:
"#ToyotaForever"
b. Posibles Nombres de Usuario: Persona: "@jayallensmith", Org: "@AmazonRetail"

2. Puntuacin:
Cualquier puntuacin que aparezca como parte del nombre de la entidad debe incluirse en
la anotacin, mientras que las puntuacines que estn ubicadas incidentalmente justo
despues de la entidad mencionada debe ser omitida. Por ejemplo:
a. Puntuacion Incluida: I.B.M., Pepsi Co., AT&T, Yahoo!, Sammy Davis Jr.
b. NO INCLUIDAS: "Lleg a Londres.", "Esa compaa (BBC) es increble"

3. Aclaraciones por repeticin:


A menudo por escrito, puede darse una aclaracin en la cual la misma entidad es referida
por un nombre ms especfico, usualmente despus de una coma. Esto puede ocurrir si
una persona es mencionada por su ttulo oficial, una referecia general o un apodo. En
esos casos, tanto la primera como segunda mencin deben ser marcadas como entidades
nombradas en vez de tener una etiqueta para las dos menciones. Ejemplo:
a."Conoc a la Secretaria de Estado de Estados Unidos[PER]", Mrs. Condoleeza Rice[PER]
b. "Lleg el jueves[FECHA] a Nueva York[LOC], La Gran Manzana[LOC]"

4. Posesivos:
Los Posesivos en ingls identificados con ('s) no deben ser incluidos como parte de la entidad.
Por ejemplo:
a. Aeropuerto de Londrs - "London[LOC]s Airport"
b. La fiesta del ao pasado - "Last year[FECHA]'s party"

5. Titulos y Tratamientos Honorficos


Ttulos y tratamientos honorficos son solamente incluidos como parte de la etiqueta Persona si es
una parte oficial de nombre, o una parte significativa del nombre. Para las personas famosas,
puedes facilmente revisar si es parte del nombre viendo la referencia oficial de la persona en
Wikipedia. Por ejemplo:
a. Incluye: "Conoc a Mr.T", "Dr. Dre es un gran artista"
b. No incluyas: " El gran Dr. Martin Luther King, Jr.", "Mr. Obama es un ciudadano privado"
Para ttulos que identifican la posicin de una persona dentro de una organizacion que son un
ttulo oficial obtenido, pueden ser incluidos ya que estos los distinguen de una persona con un
nombre similar. Ejemplo: "Reina Elizabeth 2", "Canciller Phillips", "Presidente Chvez".
6. Contexto, Contexto, Contexto!!!
Se muy cuidadoso con el contexto. Como muestra la seccin Entidades que son comnmente
confundidas, a menudo el mismo texto puede referirse a diferentes tipos de entidades
dependiendo del contexto alrededor Esto incluye el contexto gramatical/linguistico, el cual se
debe tener presente. Por ejemplo, "Halloween" y "Navidad" NO son una etiqueta EVENTO en
"Me gusta tu disfraz de Halloween", "El arbol de navidad es hermoso", sino adjetivos
describiendo el tipo de sustantivo siendo referenciado. De la misma forma, mientras que
"Palestina" es una Localizacin en una frase como "El xodo Palestino condujo a la guerra", es
solo la frase "xodo Palestino" lo que debe ser marcado como Evento. Siempre asegrate de que
las palabras que ests marcando encajen en esa categora en el contexto exacto que lo ests
marcando.

7. Errores Ortogrficos
Si hay un claro error ortogrfico, entonces las entidades mal escritas deben ser etiquetadas igual
que si estuviesen bien escritas. Si no se puede determinar si algo es un error ortogrfico o una
entidad desconocidad y la referencia externa mas el contexto no pueden aclararlo entonces debe
dejarse sin etiquetar.

8. Entidades de larga distancia.


Si la referencia de una entidad esta separada en el texto por palabras interpuestas, pero que siga
siendo parte de la misma entidad nombrada, entonces etiqueta las dos partes como una sola
entidad. Por ejemplo

a. "I love Michael fricking Jordan[PER]"


No obstante, si la separacion crea dos entidades separables, incluso si son del mismo tipo,
entonces deben ser marcadas como dos entidades del mismo tipo. Ejemplo:
b. "John[PER] y Mary Smith [PER] vinieron a cenar"
c. "El viaj a Anpolis[LOC], la capital de Maryland[LOC]"

9. Palabras designadoras.
De manera similar a los ttulos y tratamientos honorficos, los designadores (como
"organizacin", "montaa", "ciudad", "compaa", etc...) deben ser incluidos en la etiqueta
anotada si son comnmente usados cuando se hace referencia a la entidad o es parte del ttulo
oficial. Por ejemplo: "Ro", "ciudad" y "masacre", pueden o no ser incluidos dependiendo del
contexto.
a. Incluye: "Nad el Ro Misisipi[LOC]", "Yo vivo en New York City[LOC]", La Masacre de
Boston[EVENTO]"
b. NO incluye: "El ro ms grande de Europa[LOC]", "Poughkeepsie[LOC] es una ciudad de
Nueva York[LOC]", "La masacre en Alepo[LOC] de los ultimos aos"

10.Apodos
Si a una entidad se le est haciendo referencia por un apodo, y el apodo es un sustituto aceptado
comnmente o es aclarado por el contexto que se refiere a una entidad, entonces debe ser
marcado como si fuese la referencia original.
a. "Amo comprar en La Gran Manzana[LOC]" ("La Gran Manzana es Nueva York")
b. "Big Blue[ORG] lanz una nueva computadora este ao" ("Big blue es IBM)
c. "Mi abuelo peleo en el Dia D[EVENTO]" (Dia de se refiere a la Batalla de Normanda)

11. Marcado y Extensiones


a. No incluyas determinantes en las entidades anotadas. Ejemplo:
i. "Yo vist la Casa Blanca[ORG] ayer[FECHA]"
ii. "Los Estados Unidos[ORG] iniciaron una guerra"
iii. "Todos sufrieron a travs de la Gran Depresin[EVENTO]"
A menos claro que el artculo determinante sea parte del ttulo oficial o nombre de la entidad.
Para la gran mayora estos pueden ser determinados buscando en Wikipedia para saber si LA/EL
etc... est incluido en el ttulo.
iv. "Le El Seor de los Anillos[TTULO:LIBRO] el ao pasado"
b. No marques pronombres y elementos pronominales como los anafricos (Ejemplo: "uno
siempre debe lavarse el cabello", "otros harn el trabajo", "todos aman est pelcula". No deben
ser marcados para ninguna etiqeta de Persona.

S-ar putea să vă placă și