Sample 7000000144

7000000144: Human tongue dorsum microbial communities from NIH, USA - visit 2, subject 246515023

Overview

Basic Information
IMG/M Taxon OID	7000000144 Open in IMG/M
GOLD Reference (Study \| Sequencing Project \| Analysis Project)	Gs0063646 \| Gp0052640 \| Ga0031345
Sample Name	Human tongue dorsum microbial communities from NIH, USA - visit 2, subject 246515023
Sequencing Status	Permanent Draft
Sequencing Center	Baylor College of Medicine, J. Craig Venter Institute (JCVI), Washington University in St. Louis
Published?	N
Use Policy	Open

Dataset Contents
Total Genome Size	116721961
Sequencing Scaffolds	22
Novel Protein Genes	26
Associated Families	24

Dataset Phylogeny
Taxonomy Groups	Number of Scaffolds
All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	3
All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes	2
All Organisms → cellular organisms → Bacteria → Proteobacteria → Gammaproteobacteria → Pasteurellales → Pasteurellaceae	1
All Organisms → Viruses → Predicted Viral	3
All Organisms → cellular organisms → Bacteria → Proteobacteria	1
All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ctYA416	5
All Organisms → cellular organisms → Bacteria → Proteobacteria → Gammaproteobacteria → Pasteurellales → Pasteurellaceae → Haemophilus → Haemophilus influenzae	1
Not Available	6

Ecosystem and Geography

Ecosystem Assignment (GOLD)
Name	Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase
Type	Host-Associated
Taxonomy	Host-Associated → Human → Digestive System → Oral Cavity → Tongue Dorsum → Human → Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase

Alternative Ecosystem Assignments
Environment Ontology (ENVO)	Unclassified
Earth Microbiome Project Ontology (EMPO)	Host-associated → Animal → Animal surface

Location Information
Location	USA: Maryland: Natonal Institute of Health
Coordinates	Lat. (^o)	39.0042816	Long. (^o)	-77.1012173	Alt. (m)	N/A	Depth (m)	N/A
Location on Map

Zoom:	Powered by OpenStreetMap^©

Associated Families

Family	Category	Number of Sequences	3D Structure?
F018385	Metagenome	235	Y
F027205	Metagenome	195	N
F033081	Metagenome	178	Y
F051210	Metagenome / Metatranscriptome	144	Y
F054109	Metagenome	140	N
F067846	Metagenome	125	Y
F071326	Metagenome / Metatranscriptome	122	Y
F072446	Metagenome	121	N
F073671	Metagenome	120	N
F080166	Metagenome	115	N
F081455	Metagenome	114	N
F089057	Metagenome	109	N
F092229	Metagenome	107	N
F092232	Metagenome	107	N
F094007	Metagenome	106	N
F095629	Metagenome	105	N
F095631	Metagenome	105	N
F099452	Metagenome	103	N
F099453	Metagenome	103	N
F103430	Metagenome	101	N
F103433	Metagenome	101	N
F103435	Metagenome	101	N
F105376	Metagenome	100	N
F105379	Metagenome	100	N

Associated Scaffolds

Scaffold	Taxonomy	Length	IMG/M Link
C4806501	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	576	Open in IMG/M
C4808527	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	585	Open in IMG/M
C4852253	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes	957	Open in IMG/M
C4869098	All Organisms → cellular organisms → Bacteria → Proteobacteria → Gammaproteobacteria → Pasteurellales → Pasteurellaceae	1454	Open in IMG/M
C4882328	All Organisms → Viruses → Predicted Viral	4131	Open in IMG/M
C4884214	All Organisms → cellular organisms → Bacteria → Proteobacteria	14625	Open in IMG/M
SRS045715_LANL_scaffold_10343	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ctYA416	13368	Open in IMG/M
SRS045715_LANL_scaffold_108822	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ctYA416	17628	Open in IMG/M
SRS045715_LANL_scaffold_110017	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ctYA416	58693	Open in IMG/M
SRS045715_LANL_scaffold_110496	All Organisms → cellular organisms → Bacteria → Proteobacteria → Gammaproteobacteria → Pasteurellales → Pasteurellaceae → Haemophilus → Haemophilus influenzae	4607	Open in IMG/M
SRS045715_LANL_scaffold_18620	Not Available	324468	Open in IMG/M
SRS045715_LANL_scaffold_23049	Not Available	1817	Open in IMG/M
SRS045715_LANL_scaffold_33195	Not Available	2366	Open in IMG/M
SRS045715_LANL_scaffold_37884	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	513	Open in IMG/M
SRS045715_LANL_scaffold_63962	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ctYA416	18723	Open in IMG/M
SRS045715_LANL_scaffold_64296	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes	996	Open in IMG/M
SRS045715_LANL_scaffold_73382	All Organisms → Viruses → Predicted Viral	3406	Open in IMG/M
SRS045715_LANL_scaffold_79643	All Organisms → Viruses → Predicted Viral	1868	Open in IMG/M
SRS045715_LANL_scaffold_79697	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ctYA416	18866	Open in IMG/M
SRS045715_LANL_scaffold_87391	Not Available	21983	Open in IMG/M
SRS045715_LANL_scaffold_94003	Not Available	985	Open in IMG/M
SRS045715_LANL_scaffold_9877	Not Available	18155	Open in IMG/M

Sequences

Scaffold ID	Protein ID	Family	Sequence
C4806501	C4806501__gene_208905	F033081	GVMAWLLRRAMPRDTRPIFVWPKLVVAIEGYFHRRWLVAIAVLLIAVTIVIAKALLLVPGLDNSVVGLLTSIFETFLPARWATGAAWVAGMTGVFLIGDFTDYTPSQKSLHSLRATKWGVYNALLLFALWEEQAFRSGSEKWSWRERVRASVCFGAIHVVNIWYSFAAGIALSVTGFGFLLVYLWYYRKYR
C4808527	C4808527__gene_209313	F033081	GVMAWLLRRVMPQDPRPVFVWPRLVAAIGNVGYFSRRGFSVLAVGLIIVTIATIKILLFVPGLNQSVVSLLTRGLETFLPTGWATIAAWVVGTTGVFLIGSFTSSYTPSQRLLYSLEATGCGVYDALLLLALIEEQAFRSGSEKWSWHGRARASVCFGLIHVTNIWYSFAAGIALSATGFGFLLVYLWYYRKYR
C4852253	C4852253__gene_218222	F027205	MRAVKESEEFERKALAEARKRDRAEGKEPREVLHPDHKPGREIVLDYIKNPERRRTPRCSVHLEKRTANNSYRFIVDVSQVRNRELADEIEKDLFAFMDYILDEYDIPRRIKRSAK
C4869098	C4869098__gene_221338	F073671	MTNNKQAEHELAELHEKERSLEKALELVREKIRELVNYTDKNKEQK
C4882328	C4882328__gene_223472	F092232	MNTQAKFIAEYNDKNRPKFNDKFFNKSDDDIIEDLKDVILSCERNKFYTIKVLNFEVIDDYNEVQKLLIGDETPSISIKDSDLKILKVTYHVACTKDEDTFDVLIAIPRVIDGAYIHLNGNDYFPLFQLVDGSTYNNTTASSAKTQSITLKTNSNAVKMLRNFIDLNTTNEETVRAAMFSVYLFDHKVTLFEYYLARFGWYETLDKFNFEDVIKISDHDLNDPEYYTFAIANAHMKTPFYISAVKSFMDNDRILQSFVASFARAISLYATKKTTLDQIYTTEFWICKLGYNFVSSETSVFTKGNAIIESLENSYDIPTKKRLRLPDHVKEDIYSVLKWMACEFSSIRLKNNLDASSKRIRWSEYIAAMYIMLINVKLRRLPEKHDPNMEAYRIKQQLNTQPMALIAELQKSNLKGFRNMVNDRDSFLQLKYTIKGPSGPGESNSKNVARNVRAIDPSHLGIIDLNTSSASDPGVGGMLCPLNYGVYEWNSFTNEEEPNVWDENFSKMLNIYREEKGYTSAIMLADDAGLELTDTRDPAEVAFDADLLGQTIAKVARTRAFEKQLRPALINMEDSCSIYFEEV
C4884214	C4884214__gene_223830	F103433	MKEWSKNKPGVVFFFVVWFILSISFIGNFFGTGLWSGWFDGFQKDSSAIVEKTAYCKNKYDYKGPLIAVDSKEMMSQDCNPSQVEPYVSQYGLQARVIAGLSPNDTSKIPAYIKRVSIFLAVLTAFLLALVVQKIRALFGGITASVFVVMLSFSPWTAGYARNIYWIEPLLIAPFVISFVGYQYFKKSKKLWLFYIIESIAIFLKLLNGYEYVSTIAISVLVPIVFFELVHKNVKIINLWKQAVPVFTATVVAFFGAYWVNFVSLTDYYGSSDKAASAINAKASYRGISGIRSMRAYAVGNFKILRPETYNFINQIVNLDNMANNSGKTYKYIIVNVVNYLLLPAITLPVHINGMFGEFVQSILFWTILGYLIILSSRKIIGKKYSRPFLWSMNFSVIGAFCWLALMPGYALPHAHINGIIFYIPLLLFVYVLIGLWADCVVKRPVKYE
SRS045715_LANL_scaffold_10343	SRS045715_LANL_scaffold_10343__gene_12882	F095631	MASDAVSVNKTLRSYQETVLNTVQNDTLLNANIYDIHQYIENIKKRYVDEDEITLSMGIFGYMGDVNSNALQNAVTMAAEYSNEAIPIKAKFEKNVISHALMLGINKIFAEPATMQAMFVFYEDELILNTVSDTFKFDRNIKIMVGDYEFHLPYDLIIKRIELPTGEYIYTGMYDTTQSNPIITRNSNDVDPYLKPTVRSKIDGRNVVMLLVDLRQYEYTTYHKTIITTNPLESKMLQFEFDNQLAGFDVDIKEYDQPTRKLKPVYNGLNTDGINNFCNYTYIDSSTIRVMFDNSSYLPTANTEVTVNLYTCQGSNGNISYKDSIYFRVKSEKINYDRLNLLVIPTSDAQYGIDKRSIADLKKLIPKEALSRGSVTNSTDINNYFNTIDDDDNKLFFFKKMDNPLARLYYAFVLMDSPTNIIPTNTIPIEAIRRDFDNISDSNYILTAGNIIKYDGTTNASVAYQSSEEELNNARKNQFLYMNPFMCIVNKKPLYVSYYMNIMDVNKLLEFTYVNQDSKVQFVANKMNWYRHYLSERDTYVGDISIMQNIQSDIGLVHRDDPYDPEKITGVDVKVLAVFYTDEKYQVPYRWTEAEFVNYDQNTFIMDYKFKLNTDNKIDKNIKLKINNVYEVGNATRLSPGYMANNMNMKIFVFAKDVFGYNAGLHKADQIFTADFLEGYSLTNEYTVKYGIDFLYNYSDLIESHIKIRKQDNGQISYIIDRVPVISYDYVNTEERIQDFINNLEKKRIHILECLDVLEDSFGIDIKFFNTYGPSKLFYVNDGVPLNRVNLSMTFKVKFLTTTDKYLTEYIKNDIRKYIEDKSRISDIHIPNIITFITQKYAENVTYFEFLDFNGYGPGYQHIYRKDESIVGRIPEFLNINTIGTENNALDINIIIA
SRS045715_LANL_scaffold_108822	SRS045715_LANL_scaffold_108822__gene_159597	F092229	MTNEKYRFKHIPEVVLKNIRFIKDNNIDVGNGKDMLECMMNVNSVVRTKIYEDYEFAKDVAERRFGSTIEDLDMVTILQKCTTRPYNSILNNIYFRYFNSKLIDDLFKLAESPKILDLAIEYKCDYYAVNTAKTAVRRYIDDIYYNKFAIDSTIITSSRSLNDPQVNAVKSAEFTYELLMASRAEEFTPEIVRNIFIKYGLKPNPSRNVYNRINNNLNLFYYIEDYLEEYREEGKFIYGTKEYKISKDLRRLPLMLILTQLTRKNNSGYILNSNLELVKG
SRS045715_LANL_scaffold_110017	SRS045715_LANL_scaffold_110017__gene_162077	F099452	MDKTYTELLQETLSKIYELKDLNNRDRGKALTIFIGERLNRELLLSSMNIFNLYKEIVNLDDVSLLNDLRKTPWYKDWFIDDKRNSDLIDLSKFNFRSLERFEKESYLKDVEHYDFKKVIEVDSYSLYDALAEENGVDLFKLAAENILINHGFFNNTDYNLYDIPDKYMEDIEVSLYMCLLNSGNMDFMDNKTFKSTELFYIVKNNICGTIFFTLFDRMNEDTRTRAR
SRS045715_LANL_scaffold_110496	SRS045715_LANL_scaffold_110496__gene_162987	F067846	MESLQAQWERKTFNDWDKQCGKEDDHNRAIEMEIEAIKEDIANGDDDAICLFSEKMFDDDEFLKAVALGTDYEEMRIKILTAMAEDRLKQLEEDYRKGFILND
SRS045715_LANL_scaffold_18620	SRS045715_LANL_scaffold_18620__gene_24239	F051210	MNNYSQIMGNSAMMDALRASSVSAEDARLRGNEYAKMFSRNEEMMNVFGLGGNNANLLQKTFSGYSETPLLSTQYFNASVASYVSSFAGYMSIERDFDQPNGLFYWFDVLGVTDLRQVLPNLGPDQYQDVQVMGAFELPVTINTGTAAYSPLVGRKLIPGTVRVKVEDGTGKKFELIDNGQGSFMAVAGVLKTGTVNYLNGKIDFELTTAISNPAGKITIVGKEDTTGTPSCTNGASNAHANDKRFIAKMQQVALNTVPDMLVAEYNIAALGAMKKATGSDMATFLFTKLRELYTKTINYRLISTLEKGYTGDVMNDLDLSNASTSLASKFQDYRSRVDLFDAYLINVETSLATRAVKGVTTTAYVAGNQAANQFQKGGVIGKFERNTKMTYISDLLGWYDGVPVLRSTDIHEEQGEGTFYAIHKTQDGQMAPLARGIYMPLTDTPTIGNYNNPTQMASGIYYQEGVRYLAPELVQKVSFKFGF
SRS045715_LANL_scaffold_18620	SRS045715_LANL_scaffold_18620__gene_24257	F071326	MAENMASRSVERSNKFYKATLKTIKAQLAMLGTKFIVLRPKENSKWKNVFGGSYSSDSTLENDYDEFTTTLIINQNEMKDVWNRNRDSVEAITNDGSLEVGDELQYTRDKRTYRFKITLKQGYSETGDTLFSYTLMSIIETLDM
SRS045715_LANL_scaffold_23049	SRS045715_LANL_scaffold_23049__gene_30439	F105376	MNEKPEVSAKEFGALWANVEHIKESVDRHTTTLERIENIARANVTQAQLAQHEKESEEKYVKRTEIEGVMNFWSLVTSNLAKLFAIALVGLAIYATNNLIQQNKTVTELQEEVQQTQVRR
SRS045715_LANL_scaffold_33195	SRS045715_LANL_scaffold_33195__gene_44570	F103430	MEQITIKAFIGSNNKTKKLEVDKIISTVNTNHEAFTLQYPVIGCWKGETEQTAILYLSDERSKVMDTLGELKEVLDQEAIAYQIENKINLI
SRS045715_LANL_scaffold_37884	SRS045715_LANL_scaffold_37884__gene_51262	F094007	YLWILWYNSYYMKSKTVEVLELARPNRAGVIDVVDSDGNVVPLDYLGEDFVPDANSYSDEDFTKRNRIIVEMCDLFGRIRRRAGFAERHRGRGDYDRARRIERNRGSDISEVGRLAMNACEACPLKLDCELYGKLGGAVLSDVLDYKKVRTATSLTKAGKKRPGWNKGCI
SRS045715_LANL_scaffold_63962	SRS045715_LANL_scaffold_63962__gene_89400	F089057	SIPRETKYSLDDAFDIIVSNDEYSNIFRATLVFLNIDLDYHRLLLNAIKSESYTIICMINKAIPTPDLFLAKNNYECLTIALDKSYAIFDKVLGMVISQIRHTASSKEGKALGIFMTLCILNKDIDKLASLCTGYLATCRSEYMVKDLMNKSAMDAFQYMSEEDIHTVVDDINSRSVLSRYLNNM
SRS045715_LANL_scaffold_63962	SRS045715_LANL_scaffold_63962__gene_89407	F103435	MKFVFTTEPIYQYYRAYLYPSDKDKLDKDLMVEYGDYKDYWDLKNQQDALPENIFVAELTSRDYPRNPWNYVSQLISKLTYSYLIDNPEFENVFSEILFNQSEEEFYEFYKAIDRFYNGSEIFIIVSNDEYSDMVTQMMCNVIRRNYGIHPQIIYNIDDVLSIRDDIDFSPQGAQLAYLQRSAYYKLEAKRSLEPLQIWYPFDMNTYTNALE
SRS045715_LANL_scaffold_64296	SRS045715_LANL_scaffold_64296__gene_89968	F018385	WSLSRISGTETTMADLINSWLPYQELSIEKDRDPVTDDEIIYGNHVKHFTLTVCSPEGRVSKYWNARILKDQVGYCRVACPREKKILCFNWVNWTAYMFSHDGLNELVFMPDSRRRTVSQLSFDHVPMKEVK
SRS045715_LANL_scaffold_73382	SRS045715_LANL_scaffold_73382__gene_103562	F095629	MTFKERMMRELIICLCLLGCFSVANANNVEQPKEVKIVHNDDSVALHKKIYQLEKRIERLEELLKKEDK
SRS045715_LANL_scaffold_79643	SRS045715_LANL_scaffold_79643__gene_113053	F105379	MVIHFPLSQSDIESLLSISKLLKCDKILYDRNYINPIIGVGPEKSYFQTTSYMVDLSPHINNLLVNISDLKNLGKITQLEPSIENPEIAIHKPVVSVFNWDAEYVKACMNSLREYQIDDNIIARTDEFHNTDCYNELMAGSASTGAFRINIGGYMIDIPKSAIPTLKSDHVVATVYNAPNKNFNILRFKITKRNGIIVNQSMLFLPY
SRS045715_LANL_scaffold_79697	SRS045715_LANL_scaffold_79697__gene_113151	F081455	METIAKTKNIGFINNLINTCDGYIKINHKEKLRERFPRNTIIEEKDIPPVEEIGAEKVDIIDVAEEAIQQPLQNKDSSIAVNFSQMVNKPKEEVKTEVNSVPPEGETKVNVLFPKTEHILGNYVDYDSFIKIKESNTDKVVRAIRLLNYKMSDQNAAAAFAQFVSEFNPECDPNKRLRYELIRHQGREKYLVIRLSTVVNGTTKYYADIYPDLNKIDLDHHLISSAKK
SRS045715_LANL_scaffold_79697	SRS045715_LANL_scaffold_79697__gene_113152	F080166	VNILANFENYNKVVEQIFELNYYLTFKLEVTFNTIHKKINTEIKENFHSEYVVGANKLTTNLRYKYQMRLSPRGEKIGIVIDWDNYDDLCTIIEESINICDPENKMSPFKRLYSTTGDLLDIKCDSLKVRYLHLEDRWNNKVDLIPFVLVDDNRGTLTEAMRFRFNNDLTFDVPVSRLKGFRRFLMTYNPVLHAGAMARYMAITPLLGTNRQNMLR
SRS045715_LANL_scaffold_79697	SRS045715_LANL_scaffold_79697__gene_113154	F099453	MLRRKDMNRFDVIELAQQTLTFVYDTFNGKVNTLDPYTRLNFVSGYLDTKTNIARTTPYGCIYVSLEAFADTVERQGFIDTDQIRNLALEIIIHELTHVDQLIDYKYIKFNNGYREEVELKCVKQSCQWILDNIQYIRSLGLVVIPEVYQARLANLTDIIYTPKYPMAIAMAKLEYMLGKKFREFSNNNIEIQYIDRLKTHYSFMVCENRSYINSRNLNDLG
SRS045715_LANL_scaffold_87391	SRS045715_LANL_scaffold_87391__gene_124801	F105376	MNKNKKGGDMEPDVSAKEFGALQAKVEYIKDGVDKHTATLERIENIARANVAQAQLKTYITEHEQESEKKYVKRSEIEGVMNFWSLVTSNLAKLFAVALVGLAIYATNNLIQQNKAITELQEEVQTQVRRK
SRS045715_LANL_scaffold_94003	SRS045715_LANL_scaffold_94003__gene_134994	F072446	MKKLLFLLSGLCLYCLAACDNDHEPTKPVRPFHGDTLAQIAWNFRFIVENHYHSIPGIVPEGTTYRVPVIPRSVEDRTEKEYNDMELGKEAHLVFRATVHGDTINRHKKELKALSLQLNRLTETSIGTSPVLCGVKSIEAVGIAENGNTYDLRGEMKLRIRDYSYRLKYPSGIITLDCENTESLTAKYVVPLGRIREYELAEHIQPELKFYLPVKRCMDFSSIRFAITLFNGKVLSFQHKLPSKSVLQELPSKSVQQYYTPNGYEREATYFT
SRS045715_LANL_scaffold_9877	SRS045715_LANL_scaffold_9877__gene_12227	F054109	MAGRPKSKKGSKVHTAFKIYPDDKARVQAMADKLGISLSLYINKAVLEKVEHDEKSEN

Bioinformatics & Integrated Biology Lab
Institute for Fundamental Biomedical Research
Biomedical Sciences Research Center "Alexander Fleming"

NMPFamsDB

NMPFamsDB

NMPFamsDB

A database of Novel Metagenome Protein Families

A database of Novel Metagenome Protein Clusters

A database of Novel Metagenome Protein Clusters

7000000144: Human tongue dorsum microbial communities from NIH, USA - visit 2, subject 246515023

Overview

Ecosystem and Geography

Associated Families

Associated Scaffolds

Sequences