Sample 7000000063

Overview

Basic Information
IMG/M Taxon OID	7000000063 Open in IMG/M
GOLD Reference (Study \| Sequencing Project \| Analysis Project)	Gs0063646 \| Gp0052535 \| Ga0031245
Sample Name	Human tongue dorsum microbial communities from NIH, USA - visit 2, subject 763577454
Sequencing Status	Permanent Draft
Sequencing Center	Baylor College of Medicine, J. Craig Venter Institute (JCVI), Washington University in St. Louis
Published?	N
Use Policy	Open

Dataset Contents
Total Genome Size	108359052
Sequencing Scaffolds	13
Novel Protein Genes	13
Associated Families	12

Dataset Phylogeny
Taxonomy Groups	Number of Scaffolds
All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	6
All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Bacteroidaceae → Bacteroides → Bacteroides thetaiotaomicron	1
Not Available	3
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Bacilli → Lactobacillales → Streptococcaceae → Streptococcus	1
All Organisms → Viruses → Predicted Viral	2

Ecosystem and Geography

Ecosystem Assignment (GOLD)
Name	Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase
Type	Host-Associated
Taxonomy	Host-Associated → Human → Digestive System → Oral Cavity → Tongue Dorsum → Human → Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase

Alternative Ecosystem Assignments
Environment Ontology (ENVO)	Unclassified
Earth Microbiome Project Ontology (EMPO)	Host-associated → Animal → Animal surface

Location Information
Location	USA: Maryland: Natonal Institute of Health
Coordinates	Lat. (^o)	39.0042816	Long. (^o)	-77.1012173	Alt. (m)	N/A	Depth (m)	N/A
Location on Map

Zoom:	Powered by OpenStreetMap^©

Family	Category	Number of Sequences	3D Structure?
F033081	Metagenome	178	Y
F046432	Metagenome	151	Y
F051211	Metagenome	144	N
F066860	Metagenome	126	N
F077404	Metagenome	117	N
F081455	Metagenome	114	N
F089057	Metagenome	109	N
F092232	Metagenome	107	N
F095633	Metagenome	105	N
F099452	Metagenome	103	N
F103436	Metagenome	101	Y
F105378	Metagenome	100	N

Family

Category

Number of Sequences

3D Structure?

F033081

Metagenome

178

F046432

Metagenome

151

F051211

Metagenome

144

F066860

Metagenome

126

F077404

Metagenome

117

F081455

Metagenome

114

F089057

Metagenome

109

F092232

Metagenome

107

F095633

Metagenome

105

F099452

Metagenome

103

F103436

Metagenome

101

F105378

Metagenome

100

Scaffold	Taxonomy	Length	IMG/M Link
C3389430	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	586	Open in IMG/M
C3394786	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Bacteroidaceae → Bacteroides → Bacteroides thetaiotaomicron	611	Open in IMG/M
C3407449	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	680	Open in IMG/M
C3409461	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	693	Open in IMG/M
C3411058	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	703	Open in IMG/M
C3418291	Not Available	756	Open in IMG/M
C3419891	Not Available	770	Open in IMG/M
SRS015057_WUGC_scaffold_18883	Not Available	4931	Open in IMG/M
SRS015057_WUGC_scaffold_24384	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	5149	Open in IMG/M
SRS015057_WUGC_scaffold_29464	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Bacilli → Lactobacillales → Streptococcaceae → Streptococcus	2060	Open in IMG/M
SRS015057_WUGC_scaffold_69869	All Organisms → Viruses → Predicted Viral	2261	Open in IMG/M
SRS015057_WUGC_scaffold_70514	All Organisms → Viruses → Predicted Viral	1731	Open in IMG/M
SRS015057_WUGC_scaffold_75129	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	840	Open in IMG/M

Scaffold

Taxonomy

Length

IMG/M Link

C3389430

All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria

586

Open in IMG/M

C3394786

All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Bacteroidaceae → Bacteroides → Bacteroides thetaiotaomicron

611

Open in IMG/M

C3407449

All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria

680

Open in IMG/M

C3409461

All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria

693

Open in IMG/M

C3411058

All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria

703

Open in IMG/M

C3418291

Not Available

756

Open in IMG/M

C3419891

Not Available

770

Open in IMG/M

SRS015057_WUGC_scaffold_18883

Not Available

4931

Open in IMG/M

SRS015057_WUGC_scaffold_24384

All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria

5149

Open in IMG/M

SRS015057_WUGC_scaffold_29464

All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Bacilli → Lactobacillales → Streptococcaceae → Streptococcus

2060

Open in IMG/M

SRS015057_WUGC_scaffold_69869

All Organisms → Viruses → Predicted Viral

2261

Open in IMG/M

SRS015057_WUGC_scaffold_70514

All Organisms → Viruses → Predicted Viral

1731

Open in IMG/M

SRS015057_WUGC_scaffold_75129

All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria

840

Open in IMG/M

Scaffold ID	Protein ID	Family	Sequence
C3389430	C3389430__gene_161105	F033081	VRKRTLTSRPTFVWSRLVTEIENAGYFSRWKFSILAVGLIIMTIATIKMLLFVPGLNQSAVSLLTRGLETFLPTRWATATAWTVGMAGVFLMGDLTNYTPSQKILHKIKATRYEVYNIILFLALLEEQAFRSGSEKWNWRERVRASVCFGLLHIANIWYSFAAGIALSATGFGFLLVYLWYYRKYRIQIIATAAA
C3394786	C3394786__gene_162937	F077404	GKSVLHRNAIYIPPALEQYADTALLHQRFNVENKGNYLYTPFTEDNEPTIPFNYGFLHPLGERFYNCFMGKVDRILRPKADKGFIILTSYLVVLGDSYAFDTSNKDTSKLADLKYLDFRHIKRDFSYGHPYQGFTHNDRIELSNFIQSYGRQAALETANAWVMASYPFSLQSTKFENRYTRGRKLILTDGHSTLYLYFLMIDS
C3407449	C3407449__gene_167434	F095633	MKNYENSTEVGRREGLTEGELRTMGALAVEATEEFRKTIVRKEAVLLGSVPFGSWDEFAKAVQEMTAYSYEPIPVKINTKRLIATAFLDDGGEMSLEEHSVPEEVFIDLSRTRCVVDADRSHKSYEFTCPVLKKFPDGELYPIREAYVISAIDVNGSQEVDFKII
C3409461	C3409461__gene_168124	F095633	MGNYENSTEAWRREGLTEDELRTMGTLAMEATEKLKKTIIRKETVLLGSVPFGSWDEFAKAVQEMAAHSYEPIPVEINTKRLIAKAFLDDRGEMSVEENFVPEDVFIDLSRTRCDAEEDRNRKSYEFTCPALERYPDGELCPTRKAYVISAIDVNGSQEVDFNIIYGGLN
C3411058	C3411058__gene_168678	F046432	MTESKLSNIISKYQLPMDDYSVEVDGAFGRGEFFWVIKNQSTNQKYLLVNTYSHHGVESEIECYREGGFDNLEAIPRRIETLENASDADNEIFKYLFGLYSIFEMKS
C3418291	C3418291__gene_171221	F081455	METTNTENKNLFQQLARLGFNVNESLLELEKEYAPVEEIGMQNVDIIDAAEEAIQQPLANTDSSIAVNFSQMINKPEVEEVKTEVASVPDNGETKVNVFFPKNEHILSNYVDYDSFNKIKESNTETIVRAVRLLNYKMSDQNAAMKFGQFVSEFNSECDPNKRLRYELIRHQGREKDLVVRLSTVVNGTTKYYADIYPDLNKIDIDHHLISSARK
C3419891	C3419891__gene_171774	F089057	MTNIIPLIAKKYNRKGDTSGTLKSLVDDLVFIEDANDSLLFITNIPRETKYSIEEVFNIITSNDKYSEVLSNVLSSLNIDLDYHKLLLNAIDSESYKIISLISDNIPTPDLFLSKNNYGCLTAALGKSYTIFDKVLGMVISQLLHTSSKEDKILSLFMTICIVNKDIDKLASLCTGYLAITKDEVLVKDLMNESATMAFQY
SRS015057_WUGC_scaffold_18883	SRS015057_WUGC_scaffold_18883__gene_21865	F105378	MNVKVYVDKIKKWVQISSDEVLDINKNLSDLKDKEAAITNLGLYEKFISKEALESGFLPDVFTPDNIITDSTHQFVTDEEKSKWNNKLNAPVPIQDHLENNQIGYDSANSKFYIGLNNQNVLLGGSSCFDNIVVVNGFFSGNSQPTVIRNNKFNEAGQLITPVFVDVQCVEYTAGDLGEVSVSYTADAISIYNTGSFTGSFQCLIVYPLGSVNE
SRS015057_WUGC_scaffold_24384	SRS015057_WUGC_scaffold_24384__gene_28126	F051211	MRVKKAIKVFEKIRDLPYGTSGSDEVWSCYQKCVLLKQELQHIGITSQLLIGVFDWQDLQIPEHILKIRRQQYERHVILRVFIDEFAYDVDPSIDIGLTPTLPMACWDGKSSTTTMVPLRCLRVYRPHSLHERILSQLRRKIFRSNPESFYTAIDIWLATIRVS
SRS015057_WUGC_scaffold_29464	SRS015057_WUGC_scaffold_29464__gene_34753	F103436	MITTSKDGWCGKSDAEVLNSLRAWVLKCDLKYSKREALKKIDSAFALWGGRQYVAAVDLLDENEVYFSKEDWPYYALGIEILKARKYTYFY
SRS015057_WUGC_scaffold_69869	SRS015057_WUGC_scaffold_69869__gene_91075	F099452	MDKTYTELLQETLSKIYELKDLNNRDRGKALTIFIGERLNRELILSSVNVFTLYKDIINLDDVSLLADLRHTEWYKDWFTSDKRNSDLIDLSRFNFRVLERFEKEEYLKDAEHYDFEGVSEVDSYDLFDTLREDKDIELFKLAAENILINHGFFNNTDYNLYEIPDEYMSNQEVCLYMCLLNTDNLDFMDKKTFDSTLLYNIVKDRICGSVYFTIFDSLNEDTRTRAR
SRS015057_WUGC_scaffold_70514	SRS015057_WUGC_scaffold_70514__gene_92308	F092232	MNTQAKFIADYNDKNRPKFNDIFFTKSDDDIIEDLKDVILSCERNKFYTIKVLGFEVIDDYTEVQKLLIGDETPSISIKDSDLKILKVTYHVACTKDEETFDVLIAIPRVIDGAYIHLNGNDYFPLFQLVDGSTYNNTTAAAAKTQSITLKTNSNAVKMLRNFVDLNTTKEETLRMAMFSVYLFDHKVTLFEYYLARFGWYETLSKFNFEDVIKLSDHDIDDPEYYTFAIANSHMKSPFYISAVKSFVDNDRILQSFIASFTKSIASYATKKTTMDQLYTTEFWVCKLGYNFVSSETSVFTKGNAIIESLENSYDIPTKKRLRLPDHIKEDIYSVLKWMACEFSSIRLKNNLDASSKRIRWSEYIAAMYIMLINVKLRRLPEKHDPNMEAYRIKQQLNTPPMALIAELQKSNLKGFRNMVNDRDSFLQLKYTIKGPSGPGESNSKNVARNVRAIDPSHLGIIDLNTSSASDPGVGGMLCPLNYGVYEWNSFTNEEEPNVWDDNFSKMLNIYREEKGYTSAIMLADDAGLELTDNRDPEAVAFDAQLLGQTIAKVA
SRS015057_WUGC_scaffold_75129	SRS015057_WUGC_scaffold_75129__gene_101946	F066860	MTTKKQKLQKQQAIDTWIVIALWVSTIWFSLARGFITGIGGWVLALLGPWALIVSCICLAIISRQMKKRHASKNHLTTIVRVSFIVMSISLFICGLAMPDFSDMETFSTLSVYTNNAISFETSKTIAIISGFVVVLSLFVAVTFGIAEDRE

Scaffold ID

Protein ID

Family

Sequence

C3389430

C3389430__gene_161105

F033081

VRKRTLTSRPTFVWSRLVTEIENAGYFSRWKFSILAVGLIIMTIATIKMLLFVPGLNQSAVSLLTRGLETFLPTRWATATAWTVGMAGVFLMGDLTNYTPSQKILHKIKATRYEVYNIILFLALLEEQAFRSGSEKWNWRERVRASVCFGLLHIANIWYSFAAGIALSATGFGFLLVYLWYYRKYRIQIIATAAA

C3394786

C3394786__gene_162937

F077404

GKSVLHRNAIYIPPALEQYADTALLHQRFNVENKGNYLYTPFTEDNEPTIPFNYGFLHPLGERFYNCFMGKVDRILRPKADKGFIILTSYLVVLGDSYAFDTSNKDTSKLADLKYLDFRHIKRDFSYGHPYQGFTHNDRIELSNFIQSYGRQAALETANAWVMASYPFSLQSTKFENRYTRGRKLILTDGHSTLYLYFLMIDS

C3407449

C3407449__gene_167434

F095633

MKNYENSTEVGRREGLTEGELRTMGALAVEATEEFRKTIVRKEAVLLGSVPFGSWDEFAKAVQEMTAYSYEPIPVKINTKRLIATAFLDDGGEMSLEEHSVPEEVFIDLSRTRCVVDADRSHKSYEFTCPVLKKFPDGELYPIREAYVISAIDVNGSQEVDFKII

C3409461

C3409461__gene_168124

F095633

MGNYENSTEAWRREGLTEDELRTMGTLAMEATEKLKKTIIRKETVLLGSVPFGSWDEFAKAVQEMAAHSYEPIPVEINTKRLIAKAFLDDRGEMSVEENFVPEDVFIDLSRTRCDAEEDRNRKSYEFTCPALERYPDGELCPTRKAYVISAIDVNGSQEVDFNIIYGGLN

C3411058

C3411058__gene_168678

F046432

MTESKLSNIISKYQLPMDDYSVEVDGAFGRGEFFWVIKNQSTNQKYLLVNTYSHHGVESEIECYREGGFDNLEAIPRRIETLENASDADNEIFKYLFGLYSIFEMKS

C3418291

C3418291__gene_171221

F081455

METTNTENKNLFQQLARLGFNVNESLLELEKEYAPVEEIGMQNVDIIDAAEEAIQQPLANTDSSIAVNFSQMINKPEVEEVKTEVASVPDNGETKVNVFFPKNEHILSNYVDYDSFNKIKESNTETIVRAVRLLNYKMSDQNAAMKFGQFVSEFNSECDPNKRLRYELIRHQGREKDLVVRLSTVVNGTTKYYADIYPDLNKIDIDHHLISSARK

C3419891

C3419891__gene_171774

F089057

MTNIIPLIAKKYNRKGDTSGTLKSLVDDLVFIEDANDSLLFITNIPRETKYSIEEVFNIITSNDKYSEVLSNVLSSLNIDLDYHKLLLNAIDSESYKIISLISDNIPTPDLFLSKNNYGCLTAALGKSYTIFDKVLGMVISQLLHTSSKEDKILSLFMTICIVNKDIDKLASLCTGYLAITKDEVLVKDLMNESATMAFQY

SRS015057_WUGC_scaffold_18883

SRS015057_WUGC_scaffold_18883__gene_21865

F105378

MNVKVYVDKIKKWVQISSDEVLDINKNLSDLKDKEAAITNLGLYEKFISKEALESGFLPDVFTPDNIITDSTHQFVTDEEKSKWNNKLNAPVPIQDHLENNQIGYDSANSKFYIGLNNQNVLLGGSSCFDNIVVVNGFFSGNSQPTVIRNNKFNEAGQLITPVFVDVQCVEYTAGDLGEVSVSYTADAISIYNTGSFTGSFQCLIVYPLGSVNE

SRS015057_WUGC_scaffold_24384

SRS015057_WUGC_scaffold_24384__gene_28126

F051211

MRVKKAIKVFEKIRDLPYGTSGSDEVWSCYQKCVLLKQELQHIGITSQLLIGVFDWQDLQIPEHILKIRRQQYERHVILRVFIDEFAYDVDPSIDIGLTPTLPMACWDGKSSTTTMVPLRCLRVYRPHSLHERILSQLRRKIFRSNPESFYTAIDIWLATIRVS

SRS015057_WUGC_scaffold_29464

SRS015057_WUGC_scaffold_29464__gene_34753

F103436

MITTSKDGWCGKSDAEVLNSLRAWVLKCDLKYSKREALKKIDSAFALWGGRQYVAAVDLLDENEVYFSKEDWPYYALGIEILKARKYTYFY

SRS015057_WUGC_scaffold_69869

SRS015057_WUGC_scaffold_69869__gene_91075

F099452

MDKTYTELLQETLSKIYELKDLNNRDRGKALTIFIGERLNRELILSSVNVFTLYKDIINLDDVSLLADLRHTEWYKDWFTSDKRNSDLIDLSRFNFRVLERFEKEEYLKDAEHYDFEGVSEVDSYDLFDTLREDKDIELFKLAAENILINHGFFNNTDYNLYEIPDEYMSNQEVCLYMCLLNTDNLDFMDKKTFDSTLLYNIVKDRICGSVYFTIFDSLNEDTRTRAR

SRS015057_WUGC_scaffold_70514

SRS015057_WUGC_scaffold_70514__gene_92308

F092232

MNTQAKFIADYNDKNRPKFNDIFFTKSDDDIIEDLKDVILSCERNKFYTIKVLGFEVIDDYTEVQKLLIGDETPSISIKDSDLKILKVTYHVACTKDEETFDVLIAIPRVIDGAYIHLNGNDYFPLFQLVDGSTYNNTTAAAAKTQSITLKTNSNAVKMLRNFVDLNTTKEETLRMAMFSVYLFDHKVTLFEYYLARFGWYETLSKFNFEDVIKLSDHDIDDPEYYTFAIANSHMKSPFYISAVKSFVDNDRILQSFIASFTKSIASYATKKTTMDQLYTTEFWVCKLGYNFVSSETSVFTKGNAIIESLENSYDIPTKKRLRLPDHIKEDIYSVLKWMACEFSSIRLKNNLDASSKRIRWSEYIAAMYIMLINVKLRRLPEKHDPNMEAYRIKQQLNTPPMALIAELQKSNLKGFRNMVNDRDSFLQLKYTIKGPSGPGESNSKNVARNVRAIDPSHLGIIDLNTSSASDPGVGGMLCPLNYGVYEWNSFTNEEEPNVWDDNFSKMLNIYREEKGYTSAIMLADDAGLELTDNRDPEAVAFDAQLLGQTIAKVA

SRS015057_WUGC_scaffold_75129

SRS015057_WUGC_scaffold_75129__gene_101946

F066860

MTTKKQKLQKQQAIDTWIVIALWVSTIWFSLARGFITGIGGWVLALLGPWALIVSCICLAIISRQMKKRHASKNHLTTIVRVSFIVMSISLFICGLAMPDFSDMETFSTLSVYTNNAISFETSKTIAIISGFVVVLSLFVAVTFGIAEDRE

NMPFamsDB

NMPFamsDB

NMPFamsDB

A database of Novel Metagenome Protein Families

A database of Novel Metagenome Protein Clusters

A database of Novel Metagenome Protein Clusters

7000000063: Human tongue dorsum microbial communities from NIH, USA - visit 2, subject 763577454

Overview

Ecosystem and Geography

Associated Families

Associated Scaffolds

Sequences