Sample 3300006460

Overview

Basic Information
IMG/M Taxon OID	3300006460 Open in IMG/M
GOLD Reference (Study \| Sequencing Project \| Analysis Project)	Gs0063646 \| Gp0052491 \| Ga0100061
Sample Name	Human tongue dorsum microbial communities from NIH, USA - visit 2 of subject 764143897
Sequencing Status	Permanent Draft
Sequencing Center	Baylor College of Medicine, J. Craig Venter Institute (JCVI), Washington University in St. Louis
Published?	N
Use Policy	Open

Dataset Contents
Total Genome Size	115302432
Sequencing Scaffolds	15
Novel Protein Genes	19
Associated Families	17

Dataset Phylogeny
Taxonomy Groups	Number of Scaffolds
All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria → Candidatus Saccharimonia → Candidatus Nanosynbacterales → Candidatus Nanosynbacteraceae → Candidatus Nanosynbacter → Candidatus Nanosynbacter lyticus	1
All Organisms → cellular organisms → Bacteria → Proteobacteria → Gammaproteobacteria → Pasteurellales → Pasteurellaceae → Haemophilus	1
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Negativicutes → Veillonellales → Veillonellaceae	1
All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Prevotellaceae → Alloprevotella → Alloprevotella sp. oral taxon 473	2
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales → Lachnospiraceae	1
All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	1
All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Prevotellaceae → Prevotella	1
All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales	2
All Organisms → cellular organisms → Bacteria	1
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Bacilli → Lactobacillales → Streptococcaceae → Streptococcus	1
All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Flavobacteriia → Flavobacteriales → Flavobacteriaceae → unclassified Flavobacteriaceae → Flavobacteriaceae bacterium	1
Not Available	1
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales → unclassified Eubacteriales → Clostridiales bacterium	1

Ecosystem and Geography

Ecosystem Assignment (GOLD)
Name	Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase
Type	Host-Associated
Taxonomy	Host-Associated → Human → Digestive System → Oral Cavity → Tongue Dorsum → Human → Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase

Alternative Ecosystem Assignments
Environment Ontology (ENVO)	Unclassified
Earth Microbiome Project Ontology (EMPO)	Host-associated → Animal → Animal surface

Location Information
Location	USA: Maryland: Natonal Institute of Health
Coordinates	Lat. (^o)	39.0042816	Long. (^o)	-77.1012173	Alt. (m)	N/A	Depth (m)	N/A
Location on Map

Zoom:	Powered by OpenStreetMap^©

Family	Category	Number of Sequences	3D Structure?
F032313	Metagenome	180	N
F046431	Metagenome	151	Y
F046432	Metagenome	151	Y
F054110	Metagenome	140	N
F067846	Metagenome	125	Y
F068942	Metagenome	124	N
F071327	Metagenome	122	N
F072446	Metagenome	121	N
F073671	Metagenome	120	N
F076191	Metagenome	118	N
F077404	Metagenome	117	N
F078842	Metagenome	116	N
F080164	Metagenome	115	N
F092230	Metagenome	107	N
F097527	Metagenome	104	N
F103432	Metagenome	101	N
F105378	Metagenome	100	N

Family

Category

Number of Sequences

3D Structure?

F032313

Metagenome

180

F046431

Metagenome

151

F046432

Metagenome

151

F054110

Metagenome

140

F067846

Metagenome

125

F068942

Metagenome

124

F071327

Metagenome

122

F072446

Metagenome

121

F073671

Metagenome

120

F076191

Metagenome

118

F077404

Metagenome

117

F078842

Metagenome

116

F080164

Metagenome

115

F092230

Metagenome

107

F097527

Metagenome

104

F103432

Metagenome

101

F105378

Metagenome

100

Scaffold	Taxonomy	Length	IMG/M Link
Ga0100061_100001	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria → Candidatus Saccharimonia → Candidatus Nanosynbacterales → Candidatus Nanosynbacteraceae → Candidatus Nanosynbacter → Candidatus Nanosynbacter lyticus	763520	Open in IMG/M
Ga0100061_100098	All Organisms → cellular organisms → Bacteria → Proteobacteria → Gammaproteobacteria → Pasteurellales → Pasteurellaceae → Haemophilus	83170	Open in IMG/M
Ga0100061_100359	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Negativicutes → Veillonellales → Veillonellaceae	40900	Open in IMG/M
Ga0100061_101380	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Prevotellaceae → Alloprevotella → Alloprevotella sp. oral taxon 473	15510	Open in IMG/M
Ga0100061_101865	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales → Lachnospiraceae	11813	Open in IMG/M
Ga0100061_102486	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Prevotellaceae → Alloprevotella → Alloprevotella sp. oral taxon 473	8889	Open in IMG/M
Ga0100061_104362	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	4747	Open in IMG/M
Ga0100061_104528	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Prevotellaceae → Prevotella	4534	Open in IMG/M
Ga0100061_106298	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales	2999	Open in IMG/M
Ga0100061_107037	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales	2584	Open in IMG/M
Ga0100061_108711	All Organisms → cellular organisms → Bacteria	1968	Open in IMG/M
Ga0100061_109470	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Bacilli → Lactobacillales → Streptococcaceae → Streptococcus	1775	Open in IMG/M
Ga0100061_122847	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Flavobacteriia → Flavobacteriales → Flavobacteriaceae → unclassified Flavobacteriaceae → Flavobacteriaceae bacterium	640	Open in IMG/M
Ga0100061_123538	Not Available	620	Open in IMG/M
Ga0100061_125513	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales → unclassified Eubacteriales → Clostridiales bacterium	559	Open in IMG/M

Scaffold

Taxonomy

Length

IMG/M Link

Ga0100061_100001

All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria → Candidatus Saccharimonia → Candidatus Nanosynbacterales → Candidatus Nanosynbacteraceae → Candidatus Nanosynbacter → Candidatus Nanosynbacter lyticus

763520

Scaffold ID	Protein ID	Family	Sequence
Ga0100061_100001	Ga0100061_100001324	F078842	MIISSIYKTVDNDGLIAHIYEHLLAQYVLKRLQDNEFFVLSDIILSAKTYGDTCFMDAELYSSEVKKTYDEALREFDKIVIPEDDILRAASECGIEMNRNIVEVDRSELSKKLREVQLSPWRKQIDMAYRKAHDESSVNTLFRTSYIKYSKESDDLFRECVLEYSIDESHMQTPVDQALAAIVIQIVALNFLTVVREKYTVYDRGDQWSEASISVGYRMFLGLLKKDDKIINQLSYDFLEYIKSLSSSVFCDNLQKALVRCSDNHKQVILNRSTLNAILGGCVIGGKGWLEMADSARIRQMVNSIELDIYEVNS*
Ga0100061_100001	Ga0100061_100001434	F076191	MKIIAENPAEEALLWRIKALSDELVNQDNRSTNMPVWTILDNNKAGKDYGAVMYFTGKAAEQHINENAHHYEKPMTCVRSAHDNRELKDVIHLLILAGGNEIPSNHYGVLRDV*
Ga0100061_100098	Ga0100061_10009812	F073671	MKKEQAEHELAELHEKERSLEKALELVREKIRELVNYTDKNKG*
Ga0100061_100098	Ga0100061_10009818	F067846	MSIIADWERKTFNDYDRRCCAEDAYNRAIEREIECIEDDISNGDSEELWKFSEKAFEDDEFVKAIALGNDFEEMRIKILTAMAEDRLEQLEKDYRNGYILND*
Ga0100061_100359	Ga0100061_10035943	F054110	VNYQPTIKKLLKALQMNGRRYVVDVRQSWSKYDKPCKIYIVSRMYTEEEYKLTFPHKYKKGKTFKQGQLYKKESEYSSTKQHEVLLFLVKTYKGGD*
Ga0100061_101380	Ga0100061_1013801	F072446	MRKLLFLLSGLCLYCLAACDNDHEPTKPVRPFHGDTLAQIAWNFRFIVENHYHSIPGIVPERTTYRVPVIPRSVEDKTKKEYNDMELGKEAHLVFRATVHGDTINRRRKELDAIALQLGRLTETSIGTSPVLCGVKSIEAVGIAENGNTYDLSWEIKLRIRDYFGRVKHRSSGIVTLDCEDTQSKTAKYVVPLGSIREDELAEHIQPELKFYLPVKRCMDFSSISFAITLFNGKVLSFQHKLPSKSVLQELPSKSVLENYQQYGFIPESTYFTTLWPLPDYKYNEREL*
Ga0100061_101865	Ga0100061_1018655	F092230	MRQAHKRMVDKLKTRLLKVFFPLFIVCIILVAFFRQIGCGSDGDYAFQISEWGAKLKNIYGTDFINKEIIVRDNAVRVDGIRCLYAVNQNEDGLSIYLLLPGGDYLTHNYVGSSFVRFSNGSEYINMAYGEGSVEVSDSTSTGEVQNTEEKEARDKVDEAINSMRHLFASAIMVNLRVVELYKILTVCMILIAIAMTIGYYSYLKPETVYDFYCKLRRKEKYPSDVNLVKRIGFLAIILPPCMLFLLIV*
Ga0100061_102486	Ga0100061_1024864	F103432	MKLIHSLFSLPLLFVLGGLFCTTACQDDVEPTQRTGLISTDSLIHAAEVYDGKAFEHVVSTTATGLRVSEPRRVVPMLPRQLHVTMDGKTIFRRHTLPSVSAYSLQVVAVGDTIYRQKESDAQFNADLDALFRQSIGIAPRLFGVRELSVVGIDRKGKPRDLGNYSCPLLQGKRRNVNFRTKEGVFHEYFEAASVDTFSVKSNWLFKTKAEPSLYAPSFRLLVWEQPAEGCTKLRFTLTLVDGRSLVAEVPLY*
Ga0100061_102486	Ga0100061_1024865	F080164	MRPTSFVLSLLLGVIGLAPCAARQVTLRERALAFPLITEKDATEVDAPYAWRLPVVPLSLDNREIRNFAKYPLLPSLSGGILTVRVLVVGDTVAVHQDLMDDFAKRCRTTLGFGVRTAPKLFGIKGMHVYGVQKDGSRQAVDKQVTLHLPGFEKAEKPLLYKGQEGRLVLCEYYESHRGDLFLDVANAHPEIFGELCPVVDFHFPVELRRAYAWLLLEIELEDGTKLSTSLQHYDEQTSILDHPDRS*
Ga0100061_104362	Ga0100061_1043624	F046432	MWEMTESELSEVISKYQMPEGRYLVEQEGSFGESEFFWVIKNQSTNKKYLLVNTYSHHGVESELECYREGGFDNLEAIPRKIETLENASDADDEISKYLFGMYSIFEIKS*
Ga0100061_104528	Ga0100061_1045281	F032313	MYRLLILLFAITLMACDNDTPQEKPREQEKHEVPVPKPKPQFDEVGERIWYGQTPAMRLDSTDYGAGLIWVLEMRTSSIPKQRFDSLFKQTVWEIKDICAVETDLSLAKKIPRFVGGSITKEFTCRNGVILRHMQGIDINLVDTVNYVYNEDLNEIVLEGTGIRWYVLRLNKNAVEFLQQGHNIWGPFDWYYGRKSGRSEVMLEAK*
Ga0100061_104528	Ga0100061_1045282	F032313	MYRLLFLFFAVTLMACDNDTPQEKPREQEKHEVPVPKSKPQFDEVGERIWYEQTPTMRLDSTDYGAGLTPVFGMRTSSISKQRFDSLFKQTVWEIKDIRVVETDLSLAKKNPGIMGWVTTTEFTCRNGVILLHRQGIDVNHVDTVNYVYDEVGNEIVLEGTGIRWSVLRLNKNAVEFLQRGRTMWGPFDWYYGRNSGRSEVTLEAK*
Ga0100061_106298	Ga0100061_1062982	F077404	MAQQIIMTHKLAAAALSLKEPTQIGNTQNPFAMNTLKTIFTCFFTLCFMMVANSYAQKTDSINTEAGKSVLHRNAIYIPPALEQYADTALLHQRFNVENKGNYLYTPFTEDNEPTIPFNYGFLHPLGERFYNCFMGKVDRILRPKADKGFIILTSYLVVLGDSYAFDTSNKDTSKLADLKYLDFRHIKRDFSYGHPYQGFTHNDRIELSNFVQSYGRQAALETANAWVMASYPFSLQSTKFENRYTRGRKLILTDGHSTLYLYFLMIDSVAPNFDTEVLPYIKGVFRFNRFR*
Ga0100061_107037	Ga0100061_1070373	F068942	MIRKILSLPTLALCFTLCTALFAGCGENYDGSVTEVHWSNVKNPEYGNAINITLKAEGETFTTVGDHSWISFSNDASTLDTFTRHRFPEVDKDTAYYKDIVIYMTRNERERTTTLKLVAPPNRTQQPKQFKFSVSVTPPGLYIFKVRQPALPAKAQ*
Ga0100061_108711	Ga0100061_1087115	F046431	PETNNIHLKWIGPQNSSYKVYQKKPGSSTFETIGLTDFSNNATDEEVKVLNVYPHSKNIGKLWEGSSAFQTLPMVNVTYLDGHTETIEKSALLKAWMEGRNSK*
Ga0100061_109470	Ga0100061_1094701	F097527	MIYFKMEKIGNSTHNKEKKTRSENLVFNTIPAAGVEPARPCGHWVFSPARLPIPPPR
Ga0100061_122847	Ga0100061_1228472	F071327	YICVYNLDKMEDLFNSVYSTHKGISFSTVVVFGAFIFLILQVHLSYKGRISDVLRKTSFFSMILLYIQGILGVFLGIYSPEFSEASGFSSYFKLFEYGIIILTCAGMITYVYMFLKSNQILTLKVLIIALVAALLFEYAYPWRIIFG*
Ga0100061_123538	Ga0100061_1235382	F105378	MKVSVYVDKLKKWVPISSDEILDRNKNLSDVKDKDAAITNLGLYDKFISKEALQSGFLPDVFTPENIQTDADHQFVSDSDKNNWNNKLNKPVEIQTNLEENQIGYDEVNEKFYIGLNNKNVLIGGASALDNIKIVNGFFSGNSQPTIIRNTKTREDGTLISPIFVDVQCVEYTG
Ga0100061_125513	Ga0100061_1255131	F046431	MKKISRISITIILILSIIISYGSVIISRAAESELTLTPKPETNNIHLKWTGPQNSSYKVYQKKPGSSNFETIGLTDFSNNATDEEVKVLNIYPQESNADGRLWPTLNPSDVANIAKVLPKVQVTYLDGQTETIQKSALLKVWMEGRNSKRR*

3300006460: Human tongue dorsum microbial communities from NIH, USA - visit 2 of subject 764143897

Overview

Ecosystem and Geography

Associated Families

Associated Scaffolds

Sequences