Sample 7000000367

Basic Information
IMG/M Taxon OID	7000000367 Open in IMG/M
GOLD Reference (Study \| Sequencing Project \| Analysis Project)	Gs0063646 \| Gp0052911 \| Ga0031343
Sample Name	Human tongue dorsum microbial communities from NIH, USA - visit 2, subject 638754422
Sequencing Status	Permanent Draft
Sequencing Center	Baylor College of Medicine, J. Craig Venter Institute (JCVI), Washington University in St. Louis
Published?	N
Use Policy	Open

Basic Information

IMG/M Taxon OID

7000000367 Open in IMG/M

GOLD Reference
(Study | Sequencing Project | Analysis Project)

Gs0063646 | Gp0052911 | Ga0031343

Sample Name

Human tongue dorsum microbial communities from NIH, USA - visit 2, subject 638754422

Sequencing Status

Permanent Draft

Sequencing Center

Baylor College of Medicine, J. Craig Venter Institute (JCVI), Washington University in St. Louis

Published?

Use Policy

Open

Dataset Contents
Total Genome Size	97089439
Sequencing Scaffolds	21
Novel Protein Genes	21
Associated Families	20

Dataset Contents

Total Genome Size

97089439

Sequencing Scaffolds

Novel Protein Genes

Associated Families

Dataset Phylogeny
Taxonomy Groups	Number of Scaffolds
All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes	2
All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Flavobacteriia → Flavobacteriales → Flavobacteriaceae → unclassified Flavobacteriaceae → Flavobacteriaceae bacterium	1
Not Available	7
All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales	1
All Organisms → Viruses → Predicted Viral	4
All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	2
All Organisms → cellular organisms → Bacteria → Proteobacteria	1
All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ctYA416	1
All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Flavobacteriia → Flavobacteriales	1
All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → Caudovirales	1

Dataset Phylogeny

Taxonomy Groups

Number of Scaffolds

All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes

All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Flavobacteriia → Flavobacteriales → Flavobacteriaceae → unclassified Flavobacteriaceae → Flavobacteriaceae bacterium

Not Available

All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales

All Organisms → Viruses → Predicted Viral

All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria

All Organisms → cellular organisms → Bacteria → Proteobacteria

All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ctYA416

All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Flavobacteriia → Flavobacteriales

All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → Caudovirales

Ecosystem Assignment (GOLD)
Name	Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase
Type	Host-Associated
Taxonomy	Host-Associated → Human → Digestive System → Oral Cavity → Tongue Dorsum → Human → Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase

Ecosystem Assignment (GOLD)

Name

Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase

Type

Host-Associated

Taxonomy

Host-Associated → Human → Digestive System → Oral Cavity → Tongue Dorsum → Human → Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase

Alternative Ecosystem Assignments
Environment Ontology (ENVO)	Unclassified
Earth Microbiome Project Ontology (EMPO)	Host-associated → Animal → Animal surface

Alternative Ecosystem Assignments

Environment Ontology (ENVO)

Unclassified

Earth Microbiome Project Ontology (EMPO)

Host-associated → Animal → Animal surface

Location Information
Location	USA: Maryland: Natonal Institute of Health
Coordinates	Lat. (^o)	39.0042816	Long. (^o)	-77.1012173	Alt. (m)	N/A	Depth (m)	N/A
Location on Map

Zoom:	Powered by OpenStreetMap^©

Location Information

Location

USA: Maryland: Natonal Institute of Health

Coordinates

Lat. (^o)

39.0042816

Long. (^o)

-77.1012173

Alt. (m)

N/A

Depth (m)

N/A

Location on Map

Zoom:

Family	Category	Number of Sequences	3D Structure?
F018385	Metagenome	235	Y
F032313	Metagenome	180	N
F036281	Metagenome	170	N
F043990	Metagenome	155	N
F046432	Metagenome	151	Y
F051211	Metagenome	144	N
F054109	Metagenome	140	N
F054110	Metagenome	140	N
F071327	Metagenome	122	N
F071328	Metagenome	122	N
F076191	Metagenome	118	N
F081455	Metagenome	114	N
F081510	Metagenome	114	N
F085820	Metagenome	111	N
F092229	Metagenome	107	N
F095629	Metagenome	105	N
F099453	Metagenome	103	N
F103433	Metagenome	101	N
F105376	Metagenome	100	N
F105378	Metagenome	100	N

Family

Scaffold	Taxonomy	Length	IMG/M Link
C3231278	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes	783	Open in IMG/M
C3232338	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Flavobacteriia → Flavobacteriales → Flavobacteriaceae → unclassified Flavobacteriaceae → Flavobacteriaceae bacterium	794	Open in IMG/M
C3243474	Not Available	935	Open in IMG/M
C3252174	Not Available	1105	Open in IMG/M
C3253650	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales	1142	Open in IMG/M
C3258171	Not Available	1282	Open in IMG/M
C3261675	All Organisms → Viruses → Predicted Viral	1422	Open in IMG/M
C3266173	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	1690	Open in IMG/M
SRS048791_LANL_scaffold_12255	Not Available	895	Open in IMG/M
SRS048791_LANL_scaffold_13752	All Organisms → cellular organisms → Bacteria → Proteobacteria	7362	Open in IMG/M
SRS048791_LANL_scaffold_18029	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	3997	Open in IMG/M
SRS048791_LANL_scaffold_21409	Not Available	18357	Open in IMG/M
SRS048791_LANL_scaffold_22098	Not Available	829	Open in IMG/M
SRS048791_LANL_scaffold_26346	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ctYA416	1507	Open in IMG/M
SRS048791_LANL_scaffold_37229	All Organisms → Viruses → Predicted Viral	3524	Open in IMG/M
SRS048791_LANL_scaffold_62086	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Flavobacteriia → Flavobacteriales	1880	Open in IMG/M
SRS048791_LANL_scaffold_64669	All Organisms → Viruses → Predicted Viral	1898	Open in IMG/M
SRS048791_LANL_scaffold_65050	Not Available	880	Open in IMG/M
SRS048791_LANL_scaffold_65887	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes	56482	Open in IMG/M
SRS048791_LANL_scaffold_65957	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → Caudovirales	113632	Open in IMG/M
SRS048791_LANL_scaffold_9214	All Organisms → Viruses → Predicted Viral	1500	Open in IMG/M

Sequences

Scaffold ID	Protein ID	Family	Sequence
C3231278	C3231278__gene_154472	F036281	MITLIKVDEGPVDIYELRMQYLAKLKETDGVMLPTFIYRNKDLFVTEFKPTCDDQWIMYMTNAEGLITKMRIKNGDLMSNGSVLFLAEERKIYNAKEYYDYWAAREGKPAPFFYESRQYYVKSFMRVPGSTDLWITAERETGHWYTFRMSDNQKSKFTRHTM
C3232338	C3232338__gene_154879	F071327	MEDLFNSVYSTHKGISFSTVVVFGAFIFLILQVHLSYKGRISDVLRKTSFFSMLLLYIQGILGVFLGIYSPEFSEASGFSSYFKLFEYGIIILTCAGMITYVYMFLKSNQIL
C3243474	C3243474__gene_159618	F085820	MRSTFYLFAMLFLATTFFSCETVEPSPRPTWGEIVNPIEAFMYPRDLKVVAAREEGRRWLILVVPDSTKSSFAPTSKSTPAEVARYKELSQLVGNPTEPVVNECHFHRTWLTQGVKAIRVVRTQADGRDEDVTAQCGNLYFYTDKQIFDCQFKCGNRSIFAKPLGETVEADYLWLPGRDVFGLIAPPNPDHLKQRIVLRLADGTEIEKELSDKGKK
C3252174	C3252174__gene_163581	F105376	MNEKSEVSAKEFGALQAKVEYIKDGVDKHTVMLERIENIAQANVTQAQLAKHEKESEEKYVKRTEIEGVMNFWSLVTSNLAKLFAIALVGLAIYATNNLIQQNKTVTELQEEVQQSQVKR
C3253650	C3253650__gene_164305	F071328	MKWEFILEGEYIVEFVKLCKHLVLERTIDPNKHQAAAIYLRYSSQLLLKKRRAIRRLGIEKKYVSAILRQYGIHYIEYGDNEHRVFFLDRGINLYFSKHDQSSIYIIQRIEFSNEEYRSFILKVLPVKKSEW
C3258171	C3258171__gene_166407	F054109	MTGRPKSKKGMKVHTAFKIYPADKARAQAMADKLDLTLSAYVNKAVLEKVARDEKSED
C3261675	C3261675__gene_168064	F018385	MMTERATRWDPYKELSIEKDRDPVLDDEIIYGNNVKHFTLTVYSHDGRVSKYWNARVLPDQVGNCRIACPRDGKILCFNWFNWTAYMFTHDGMNELVLMPDSKRRIVSQLSFDNSGGKEV
C3266173	C3266173__gene_170431	F046432	VISKFQMPEGRYSIEQEGSFGRGEFFWIIKNQSTNQKYLLMNTYSHHGVESELECYREEGFDNLEAIPRKIETLEIPSDAEDEISKYLFGFYSIFEIKS
SRS048791_LANL_scaffold_12255	SRS048791_LANL_scaffold_12255__gene_13355	F081455	METTVNKNIMVNEDTTAFDDFITYALTRKLPEGYDIPPVEEIGMQNVEIIDSAEEAIQQPLANTDSSIAVNFSQMINKPEEVKTELVSTPDNGEAKVNVVFPKTEHILGNYVDYDSFNKIKESNTDKVVRAVRLLNYKMADQNAAMKFGQFVSEFNPNGDPNKRLRYELIRHQGREKDLVVRLSTVINGTTKYYADIYPDLNKIDIDHHLISSARK
SRS048791_LANL_scaffold_13752	SRS048791_LANL_scaffold_13752__gene_15068	F103433	MKEWSKNKPGVVFFFVVWFILSISFIGNFFGTGLWNGWFDGFQKDSSAIVEKTAYCKNKYDYKGPLIAADSKDYNKIMMSQDCNPSQVKPYVSQYGLQARVIAGLSPNDASKIPAYIKRVSIFLAVLTAFLLALVVQKIRALFGGITASVFVVMLAFSPWIAGYARNIYWIEPMLIAPFVISFVGYQYFKKSKKLWLFYIIESVAMFLKLLNGYEYVSTIAISVLVPIIFFELVHKNVKIINIWKQAVPVFAATVVAFFGAYWVNFMSLTDYYGSSDKAANAINARASDRGISGIRSMRAYAVGNFKILRPETYNFINQLVNLDNMANNSGKTYKYIIVNVVNYLLLPAITLPVHINGMFGEFIQSILFWTILGYLIILSSRKIIGKKYSRPFLWSMNFSVIGAFCWLALMPGHALPHAHINGIIFYIPLLLFVYVLIGLWADYVVKRTVKYE
SRS048791_LANL_scaffold_18029	SRS048791_LANL_scaffold_18029__gene_19723	F051211	MRVKKAIKVFEKIRDLPYGTSGSDEVWSCYQKCVLLKQELQHIGITSQLLIGVFDWQDLQIPEHILKTRRQQYERHVILRVFIDEFAYDVDPSIDIGLTPMLPMTCWDGKSSTTTMAPLRYLRVYRPHSLHERILSQLRRKIFRSNPESFYTAIDIWLATIRVS
SRS048791_LANL_scaffold_21409	SRS048791_LANL_scaffold_21409__gene_23515	F076191	MKIIAENPAEEALLWRIKALSDELVNQDNRSTSMPVWTILDNNKAGKDYGAVMYFTGKAAEQHINENDHHYKKPMICVRSAHDNRELKDIVHLLILAGGNEIPSNHYGVLRDV
SRS048791_LANL_scaffold_22098	SRS048791_LANL_scaffold_22098__gene_24369	F032313	MACDNDTPQEKPREQEKHEVPVPKSKPQFDEVGERIWYGRTPAMRLDSTDYGAGLTSVFGMRTSSIPKQRFDSLFKQTVWEIKDIRVVETDLSLAKKNPGIMGWVTTTEFTCRNGVIVLHRQGIDVNHVDTVNYVYDEVGNEIVLEGTGIRWSVLRLNKNAVEFLQRGRTMWGPFDWYYGRNSGRSEVTLEEK
SRS048791_LANL_scaffold_26346	SRS048791_LANL_scaffold_26346__gene_29279	F099453	MLRRKDMNRFDIIELAQETLIFVYNTFNGKVNTLDPYTRLNFVAGYLDTKTNIARTTPYGCIYISLEAFADTVEAHKFIDTDQIRNLALEIIIHELTHVDQLIDYKYIKFNNGYRDEIELQCVKQSCQWILDNIQYIRSFGLVVIPEVYQARLANLTNIIYTPKYPMAIAMGKLEYMLGRKFREFSNNNIEIEYVDRLKTHYTFMVCENRIYINSANLNDLGERLLNDKQYTVEYLEYGDSKLVIKITQGA
SRS048791_LANL_scaffold_37229	SRS048791_LANL_scaffold_37229__gene_42213	F092229	MNKEYRFDHIPEVVLRNVKFIRENNIDIGTGDDVLECMMDINPVLRQRIYDDYDLAKDVAERRFNSTIEDLDLTTILQKCTTRPYIAILNNIYFRYFNSKLIDDMFKLGESIKVLDLAIEYECEYYTVNSAKTNIRRYMQQAYYDKYAADADIISSHRVLSDPQVNAVKSAEFTYDLLVAARSENFNPEMVRDIFLKYGLKTNSSRNLYNRMDNNLSLFYYLEDYLEEYVNTGKFTYGSQEYSTIKEFKYLPLMNVLTQLTRSNPSGYILNHKLELVKG
SRS048791_LANL_scaffold_62086	SRS048791_LANL_scaffold_62086__gene_75143	F043990	MIKKLGIIFTFGVIILGIVVYADHKIERSWIEGEFGVNMSNMNIDEKYRKEEWAPNGDGEKTIILTYDQLDNSFTKLNKLPIKEDLPPNGIPKQFLNIANGYYKYIGDENDDRDFGILIVDTTRKEICIYYQIL
SRS048791_LANL_scaffold_64669	SRS048791_LANL_scaffold_64669__gene_80523	F054110	VVLDVNYQPTIKKLLKALQMNGRRYVVDVRQSWSKFDKPCKVYIVNRMYTEEEYKLTFPHKYKKGKTFKQGQLYKKESEYSSTKQHEVLLFLVRTYKGGD
SRS048791_LANL_scaffold_65050	SRS048791_LANL_scaffold_65050__gene_81437	F032313	MYRFLILIFALMLMACDNDTPQEKPREQEKHEVPVPKPKPQFDEVGERIWYGQTPAMRLDSTDYGAGLIWVLEMRTSSIPKQRFDSLFKQTVWEIKDLCAVETDLSLAKKIPKFVGGSITKEFTCRNGVILRHMQGIDINLVDTVNYVYNEDLNEIVLEGTGIRWYVLRLNKNA
SRS048791_LANL_scaffold_65887	SRS048791_LANL_scaffold_65887__gene_84480	F081510	MLSKTKGETKMKLPNMKAIKSAAKHSYTVSKILAKKYAPVALVTTGLVGYGVAVYKGIQSGKKLEATKAKYEAKDEAGEEYTRMDVVKDVAKDVAVPVAIAVASTAAIGLGFAIQTNRLKAVSAALTMVTEEHARYRLRAKEVLDEETFKKIDAPIETKKVEIDGKEVEVESIVPKEGDFYGRWFKYSRHYASDDPDYNEAWVKEVDNMLTQKINTQSGGGMLTFAEVLDALGFEVPKAALPFGWTDTDGFYLEWDTHEVWNEDKQEHEPQIYVRWQTPRNLYSTTNFRDIIPGRKQLV
SRS048791_LANL_scaffold_65957	SRS048791_LANL_scaffold_65957__gene_85280	F105378	MNVKVYVDKIKKWVQISSDEVLDVNKNLSDLKDKEAAITNLGLYEKFISKEALESGFLPDVFTPDNIVTDSTHQFVTDEEKNKWNNKLNVPVPMQDHLANNQIGYDSVNSKFYIGLNNQNVLLGGSSCFDNIIVVNGFFSGNSQPTVIRNNKFNEAGQLITPVFVDVQCVEYTAGDLGEVSVSYTTDAISIYNTGSFTGSFQCLIVYPLGSVNE
SRS048791_LANL_scaffold_9214	SRS048791_LANL_scaffold_9214__gene_9911	F095629	MRELIICACLLGCFGVANAAAPVEQPKEVKVVHNDDSVALHKKVYKLEQRIERLEKLLAEKEGK

NMPFamsDB

NMPFamsDB

NMPFamsDB

A database of Novel Metagenome Protein Families

A database of Novel Metagenome Protein Clusters

A database of Novel Metagenome Protein Clusters

7000000367: Human tongue dorsum microbial communities from NIH, USA - visit 2, subject 638754422

Overview

Ecosystem and Geography

Associated Families

Associated Scaffolds

Sequences